2022年3月15日
桔妹导读: 滴滴的路线引擎每天要处理超过400亿次的路线规划请求,路径规划是滴滴地图输出的核心服务之一。不同于传统的路径规划算法,本文主要介绍的是一次深度强化学习在路径规划业务场景下的探索,目标是为用户规划出最符合司乘双方习惯的路线,降低偏航率。 当我们打开滴滴使用网约车服务时,出发……
阅读全文
2022年3月15日
今天,推荐系统的模型和应用已经相当成熟,然而部署一套全新的推荐系统,甚至仅在已有系统上添加数据维度和模型优化依然是非常耗时耗力的事情。 这是由于不同数据源的分布不尽相同,要达到满意的建模效果,每个建模的环节,包括数据处理、特征工程、模型的选择和超参数选择等都需要随之变动和优化。 以往……
阅读全文
2022年3月15日
文章作者:省钱快报算法团队 编辑整理:Hoh Xil 内容来源:作者授权 出品平台:DataFun 导读: 省钱快报是一家中小型综合类电商 APP,近 2 年平台规模有了较大增长,AI 在平台业务发展中发挥了巨大作用。 本文以推荐场景优化在省钱快报的发展为脉络,对于中小型电商公司在资源有限的客观条件下,对……
阅读全文
2022年3月15日
桔妹导读: 滴滴ElasticSearch平台承接了公司内部所有使用ElasticSearch的业务,包括核心搜索、RDS从库、日志检索、安全数据分析、指标数据分析等等。平台规模达到了3000+节点,5PB 的数据存储,超过万亿条数据。平台写入的峰值写入TPS达到了2000w/s,每……
阅读全文
2022年3月15日
分享嘉宾:张庭 菜鸟 数据工程师 文章整理:comn 出品平台:DataFunTalk 导读: 供应链物流场景下的业务复杂度高,业务链路长,节点多,实体多,实时数仓建设难度高。菜鸟跨境进口业务场景更是如此,更复杂的场景带来更复杂的实体数据模型,对接的业务系统多导致ETL流程特别复杂,还有海量……
阅读全文
2022年3月15日
分享嘉宾:周国睿 阿里 高级算法专家 编辑整理:崔媛媛 出品平台:DataFunTalk 导读: 本文的主题为新一代Rank技术,由来自阿里巴巴定向广告团队的周国睿老师分享,主要介绍当前团队在排序算法方面的新工作和新想法。 01 新一代Rank技术背景介绍 在分享之前先介绍下阿里巴巴整个淘系内部的定……
阅读全文
2022年3月15日
文章作者:王松林、唐国瑜 京东算法工程师 编辑整理:Hoh 内容来源:作者授权 出品平台:DataFunTalk 导读: 本文将介绍京东搜索场景中的两块技术, 语义检索与商品排序。在业界检索算法基础上,我们提出一系列更适用于电商场景的检索排序算法,在业务上取得了显著收益。其中的多篇论文已被 KDD/SIGIR 等……
阅读全文
2022年3月15日
网上铺天盖地的都是面试官面试候选人的面试问题,而针对面试过程面试官的最后一问:“最后还有什么想问的么?”,没有问题,略显尴尬。发现github上有位叫 viraptor 的小哥反向思维,整理了一份求职反问手册,从岗位职责、基础设施、团队情况、公司技术发展、公司变现途径、是否坐班、办公室情况等角度,……
阅读全文
2022年3月15日
添加微信:julyedufu77,回复 “ 7 ”,领取最新升级版《名企AI面试100题》电子书!! 11、当参数量 » 样本量时候, 神经网络是如何预防过拟合? 正则化 2. Early Stopping 3. Dropout 4. 数据增强 过拟合即在训练误差很小,而泛化误差很大,神经网络时避免过拟合的方法: 正则化 正则化的思想十分简单明了。由于模……
阅读全文
2022年3月15日
作者:Samuele Mazzanti 编译:ronghuaiyang 导读: 如何让复杂的模型具备可解释性,SHAP 值是一个很好的工具,但是 SHAP 值不是很好理解,如果能将 SHAP 值转化为对概率的影响,看起来就很舒服了。 在可解释性和高性能之间的永恒的争斗 从事数据科学工作的人更了解这一点:关于机器学习的一个老生常……
阅读全文