2022年3月15日
稿 深度学习平台团队 TensorFlow Serving 由于其便捷稳定的特点在 CTR(Click-through Rate,点击率) 预估业务场景被广泛的使用,但是其运行时会出现内存不断增长的问题,也不断有相关issue 被提交到 Github 社区,且目前都是 Open 状态。本文分享了爱奇艺深度学习平台在实践中发现的两个 TensorFlow Serving内存泄漏 问题,并修复和提交了 PR 到社……
阅读全文
2022年3月15日
导读: 最近接了一个大flow优化任务,这个任务是用来做新用户的归属,属于比较重要的任务,但是任务产出时间比较晚,一般要到15点之后才能完成,非常影响数据分析。和这个任务有关联的flow有4个,主flow有67个节点和其他flow加在一起超过了100+节点。 Flow优化过程包括: 长……
阅读全文
2022年3月15日
**简介:**5 月 22 日北京站 Flink Meetup 分享的议题。 本文整理自爱奇艺技术经理韩红根在 5 月 22 日北京站 Flink Meetup 分享的议题《Flink 在爱奇艺广告业务的实践》,内容包括: 业务场景 业务实践 Flink 使用过程中的问题及解决 未来规划 一、业务场景 实时数据在广告业务的使用场景主要可以分为四个方面: 数据大屏: 包括曝光……
阅读全文
2022年3月15日
写在前面的话 GBDT和LR的融合在广告点击率预估中算是发展比较早的算法,为什么会在这里写这么一篇呢?本来想尝试写一下阿里的深度兴趣网络(Deep Interest Network),发现阿里之前还有一个算法MLR,然后去查找相关的资料,里面提及了树模型也就是GBDT+LR方案的缺点,恰好之前也不太……
阅读全文
2022年3月15日
文章作者:i技术会 内容来源:爱奇艺技术产品团队 导读: 本文主要介绍如何通过数仓平台进行数据建模,从而构建统一、规范化、标准化的数据仓库体系,以及围绕核心数据仓库元数据中心建设数据图谱等方面的实践和心得,来解决实际场景中遇到的各种问题,学习数据仓库整体建设思想以及元数据应用服务搭建。……
阅读全文
2022年3月15日
浅梦的学习笔记 关注专栏写文章 “ 本文介绍了跨境电商Etsy如何利用用户历史交互行为的类型(如浏览,喜欢,收藏,加购,购买等)来完善物品的embedding表示,并进行可解释推荐。在离线和在线实验中均验证了引入交互类型信息后对于建模用户行为的准确性有提升。 ” 背景和介绍 工业级的推荐系统……
阅读全文
2022年3月15日
作者:沈磊 团队:大数据 前言 目前有赞实时任务主要以 Flink 为主,为了保证实时任务的容错恢复以及停止重启时的状态恢复,几乎所有的实时任务都会开启 Checkpoint 或者触发 Savepoint 进行状态保存。由于 Savepoint 底层原理的实现和 Checkpoint 几乎一致,本文结合 Flink 1.9 版本,重点讲述 Flink Checkpoint 原理流程以及常见原因分析,让用户能够更好的理解 Flink Chec……
阅读全文
2022年3月15日
阿里近几年公开的推荐领域算法有许多,既有传统领域的探索如MLR算法,还有深度学习领域的探索如entire-space multi-task model,Deep Interest Network等,同时跟清华大学合作展开了强化学习领域的探索,提出了MARDPG算法。 上一篇,我们介绍了深度兴趣网络(Deep Interest Networ……
阅读全文
2022年3月15日
作者介绍 马超群, 洋码头高级算法工程师 具有多年数据挖掘、算法、机器学习的研究与实践经验,负责洋码头推荐等系统的算法研究与开发 | 电子商务网站的推荐系统是根据用户的兴趣特点和购买行为,向用户推荐其感兴趣的信息和商品的一个系统,在主流电商平台均具有广泛应用。从16年开始,洋码头根据自己的……
阅读全文
2022年3月15日
在新型冠性肺炎的侵袭下,似乎那一夜之间,国内大多数企业都接受了在线办公,云端协同的理念。其中,在线项目协作需求激增,根据媒体调查报告显示,疫情在家办公期间,在线项目管理工具每天应用的平均时长达 5.89 小时,成为疫情期间远程办公的最热 SaaS 应用 Top 5。 如今,企业已陆续复工,越来越多企业都意识到……
阅读全文