2022年3月15日
文章作者:宫士敏 小米大数据部 算法团队 Leader 编辑整理:王成林 内容来源:AI科学前沿大会 出品社区:DataFun 注:欢迎转载,转载请注明出处 一、背景 以深度学习为代表的 AI 技术近年来在搜索推荐场景中得到广泛的应用,对用户 Query 和内容侧的理解不断深入,用户体验得到显著提升。 搜索是一种典型的 AI 应用,……
阅读全文
2022年3月15日
分享嘉宾:天师 阿里巴巴 高级算法专家 编辑整理:王洪达 出品平台:DataFunTalk 导读: 本文主要从偏向底层的推荐算法角度来阐述信息流推荐系统升级如何助力用户增长。我们知道,内容信息流实际上已经算是信息流中比较小的概念,其中包含图文信息流、短视频信息流和内容+电商信息流,而对于用户……
阅读全文
2022年3月15日
作者简介 少伟,负责度假起价、搜索的研发工作,资深技术控。 锦涛,负责度假搜索及相关子系统的建设,对搜索引擎、NLP等有浓厚兴趣。 背景介绍 携程度假搜索引擎(以下简称为引擎):携程度假搜索引擎是一个专注在旅游行业的垂直搜索引擎,用来查找符合从出发地到目的地的相关旅游产品(跟团、自由行、……
阅读全文
2022年3月15日
转载自 美团技术团队 追求卓越、学习成长是美团的基因,因此工作之余,多读书、读好书蔚然成风——我们有专门的P2P图书馆、不时的好书推荐、图书打卡交流群和各种丰富读书活动…… 本文是作者阅读John Ousterhout的《A Philosophy of Software Design》之后,结合自己的工作经验,对“降低复杂性”做……
阅读全文
2022年3月15日
分享嘉宾:沐沐老师 前百度资深研发 编辑整理:赵丽 内容来源:2019 DataFun Live 11 出品社区:DataFun 导读: 今天为大家分享的是搜索引擎中的 web 数据挖掘。首先介绍下搜索引擎。实际上,我们每天都会使用的搜索引擎,我们会输入关键词 query 和需求,搜索引擎会根据算法将于 query 最相关且最权威的结果呈现给用户。……
阅读全文
2022年3月15日
分享嘉宾:于茜 微博 高级算法工程师 编辑整理:王洪达 内容来源:Flink Forward 导读: 微博作为国内比较主流的社交媒体平台,目前拥有2.22亿日活用户和5.16亿月活用户。如何为用户实时推荐优质内容,背后离不开微博的大规模机器学习平台。本文由微博机器学习研发中心高级算法工程师于茜老师分享,主……
阅读全文
2022年3月15日
360搜索技术团队 目前 360 搜索每日抓取的网页数量高达十亿,已经收录的网页基本上是万亿级别的网页集合,实际可检索的网页是在一个百亿级别的网页集合里。 目前 360 搜索的单日流量是亿级 pv。我们目前的在线、离线机群有几万台服务器来维护这么大量级的计算。 主要内容 我今天的分享的主要会侧重于百亿级网……
阅读全文
2022年3月15日
前言 我们小伙伴应该都听说够消息中间件MQ,如:RabbitMQ,RocketMQ,Kafka等。引入中间件的好处可以起到抗高并发,削峰,业务解耦的作用。 如上图: (1)订单服务投递消息给MQ中间件 (2)物流服务监听MQ中间件消息,从而进行消费 我们这篇文章讨论一下,如何保障订单服务把……
阅读全文
2022年3月15日
分享嘉宾:周国睿 阿里妈妈 算法专家 编辑整理:鞠芳 内容来源:AI 科学前沿大会 出品社区:DataFun 注:欢迎转载,转载请注明出处 本次分享内容提纲: 电商数据个性化预估的特性 阿里妈妈模型迭代路径 Where to Go 一、 电商数据个性化预估的特性 首先介绍一些基础的背景知识,阿里的展示广告按展示元素主要分为……
阅读全文
2022年3月15日
Conference Paper · May 2018 The Anatomy of a Large-Scale Online Experimentation Platform。 因为工作负责和ABTest相关的事情,所以对ABTest系统理论与工程落地情况一直在调研,根据上面这篇论文,我们一起来学习下微软EXP系统的工程实现。摘要及其相关工作啥的废话略过,先放一张架构图: 整个系统包含四部分: 1. experiment portal: po……
阅读全文