2022年3月15日
这里是 「王喆的机器学习笔记」 的第八篇文章,今天我们聊一聊KDD 2018的Best Paper,Airbnb的一篇极具工程实践价值的文章 Real-time Personalization using Embeddings for Search Ranking at Airbnb 。 相信大家已经比较熟悉我选择计算广告和推荐系统相关文章的标准: 工程导向的; 阿里、facebook、google等一线互联网公司出品……
阅读全文
2022年3月15日
谈到用户画像,大体可以用俩个词概述"persona" 和 “profile”。两者区别在于使用者的差异。Persona 也叫做用户角色,是描绘抽象一个自然人的属性,主要是讨论产品、需求、场景、用户体验的时候使用。Profile 是和数据挖掘、大……
阅读全文
2022年3月15日
李天朔@快手 Flink 中文社区 摘要:本文整理自快手数据技术专家李天朔在 5 月 22 日北京站 Flink Meetup 分享的议题《快手基于 Flink 构建实时数仓场景化实践》 一、快手实时计算场景 快手业务中的实时计算场景主要分为四块: 公司级别的核心数据: 包括公司经营大盘,实时核心日报,以及移动版数据。相当于团队会有公司的大盘指标……
阅读全文
2022年3月15日
“ 这两年深度模型大火之后,各个团队都卯足了劲把网络规模做大做深,花了很大力气好不容易离线 auc 涨了不少,上线一看效果 ctr 和 cpm 反而下降。本文例举几种可能的原因和解决办法。 ” 作者:辛俊波 腾讯高级研究员 专注推荐/广告/深度学习原文链接: https://www.zhihu.com/question/32218407/answer/1172781649 1. 特征/数据出现穿越 一般就是使用了和 label 强相关的特征导致……
阅读全文
2022年3月15日
分享嘉宾:章莺 网易云音乐 资深算法工程师 编辑整理:汪方野 出品平台:DataFunTalk 导读: 近年来,网易云音乐作为一匹黑马迅速在移动音乐APP占据市场,2016年用户量就突破了2亿,而这与它优质的推荐系统必不可分。网易云音乐推荐系统致力于通过AI算法的落地,实现千人千面的个性化音……
阅读全文
2022年3月15日
陈兴振:TEG技术工程平台群AI Lab架构师,AI平台部负责人;目前主要负责AI算法平台及周围子系统的建设工作 背景 AI浪潮正引领行业变革,为加速AI应用的落地,58同城TEG共享服务线AI Lab研发设计了58AI算法平台(以下简称WPAI)以提升集团各产品业务部门的AI研发效率。……
阅读全文
2022年3月15日
作者: 翟佳@Pulsar 摘要: StreamNative 联合创始人翟佳在本次演讲中介绍了下一代云原生消息流平台 Apache Pulsar,并讲解如何通过 Apache Pulsar 原生的存储计算分离的架构提供批流融合的基础,以及 Apache Pulsar 如何与 Flink 结合,实现批流一体的计算。 Apache Pulsar 相对比较新,它于 2017 年加入 Apache 软件基金会,2018 年才从 Apache 软件基金会毕业并……
阅读全文
2022年3月15日
项目一:modeltime — 时间序列预测模型和机器学习框架 时间序列在变化。企业现在每天需要10,000多个时间序列预测。这就是我所说的高性能时间序列预测系统(HPTSF)-准确,稳健和可扩展的预测。高性能预测系统将为公司节省数百万美元。 特点与优势: Modeltime在一个框架中解……
阅读全文
2022年3月15日
前言 最近在工作中参与组内服务稳定性建设,梳理我们目前服务现状并接入公司自研稳定性保障平台。对公司内自研组件以及业界流行的Hystrix做了学习,Netflix Hystrix 里面大量RxJava响应式实现,实在看着有点绕。所以在这里梳理一些实践以及Hystrix知识点。 为什么要做这个事情 服务的……
阅读全文
2022年3月15日
近年来,自然语言处理技术已经取得了长足进步,成为应用范围最广泛,也是最为成熟的 AI 技术之一。但实际上,自然语言处理技术在商业化应用上却鲜有突破性进展,真正成功或者能够完美满足人们日常生活需求的产品并不多。 回首 2018 年,自然语言处理领域不乏进展和惊喜,比如谷歌提出的 BERT 模型打破 11 项世界纪录……
阅读全文