2022年3月15日
作者:朱小强(怀人) 0. 序曲 纵观这两年业界技术的演化趋势,几乎主流的团队都已经完成了深度学习为代表的技术升级,进入到算力吃紧、模型红利放缓的新瓶颈期。去年在 《深度学习推荐系统》序言 一文中,我对工业级深度学习技术迈入新的 2.0 进阶阶段的特征做过一些探讨: 可以预见,在工业级深度学习2.0阶……
阅读全文
2022年3月15日
作者:Robbe Sneyders 编译:ronghuaiyang 给大家介绍一下如何在生产中部署基于嵌入的机器学习模型。 由于最近大量的研究,机器学习模型的性能在过去几年里有了显著的提高。虽然这些改进的模型开辟了新的可能性,但是它们只有在可以部署到生产应用中时才开始提供真正的价值。这是机器学习社区目……
阅读全文
2022年3月15日
作者:Eric He 编译:ronghuaiyang 导读: 这是Rocketmiles的搜索排名序列的第二部分。 Why we chose LambdaMART for our hotel ranking model Part 2 of Rocketmiles’ search result ranking series Eric He 原文: https://medium.com/rocket-travel/why-we-chose-lambdamart-for-our-hotel-ranking-model-45f84e22cec 当你是一家像Rocketmiles这样的电子商务公司时,提供无缝的购买体验是你将自己的在线商店与其他商家区分……
阅读全文
2022年3月15日
来源:Datawhale 寄语:本文介绍了 SVM 的理论,细致说明了“间隔”和“超平面”两个概念;随后,阐述了如何最大化间隔并区分了软硬间隔 SVM;同时,介绍了 SVC 问题的应用。最后,用 SVM 乳腺癌诊断经典数据集,对 SVM 进行了深入的理解。 支持向量机(support vector machines, SVM)是一种二分类模型,它的……
阅读全文
2022年3月15日
摘要: 本文整理自云邪、雪尽在 Flink Forward Asia 2020 的分享,该分享以 4 个章节来详细介绍如何利用 Flink SQL 构建流批一体的 ETL 数据集成, 文章的主要内容如下: 数据仓库与数据集成 数据接入(E) 数据入仓/湖(L) 数据打宽(T) 数据仓库与数据集成 数据仓库是一个集成的(Integrated),面向主题的(Subjec……
阅读全文
2022年3月15日
文章摘要:如何设计RPC通信层模型是任何一款性能强劲的MQ所要重点考虑的问题 在(一)篇中主要介绍了RocketMQ的协议格式,消息编解码,通信方式(同步/异步/单向)、消息发送/接收以及异步回调的主要通信流程。而本篇将主要对RocketMQ消息队列RPC通信部分的Netty多线程……
阅读全文
2022年3月15日
作者:爱奇艺技术 ,该文根据【i 技术会】现场演讲整理而成 在建设机器学习平台之前,爱奇艺已经拥有比较成熟的深度学习平台 Javis,但是 Javis 面向的用户比较高阶、专业的算法工程师,需要通过提交代码到专用计算集群上运行计算,使用门槛比较高。 另外,算法除了深度学习以外,机器学习,数据挖掘、数据……
阅读全文
2022年3月15日
分享嘉宾:陈立玮 博士 腾讯 高级研究员 编辑整理:王吉东 出品平台:DataFunTalk 导读: 当前知识图谱已经被广泛应用在自然语言处理的各项任务中,但知识图谱中实体间关系的缺失也给其实际的应用带来了很多问题。因此,目前学术界围绕知识图谱的补全进行了大量的研究工作。本文主要对知识图谱补全……
阅读全文
2022年3月15日
作者:吴忠强,Datawhale 优秀学习者 转载地址 系列文章: 零基础入门数据挖掘——数据分析实战 摘要:对于数据挖掘项目,本文将学习应该从哪些角度做特征工程?从哪些角度做数据清洗,如何对特征进行增删,如何使用 PCA 降维技术等。 特征工程(Feature Engineering)对特征进行进一……
阅读全文
2022年3月15日
分享嘉宾:陈炜于 阅文集团 高级总监 编辑整理:李沛欣、马宇峰 出品平台:DataFunTalk **导读:**阅文作为国内最大的网络文学公司,我们在实践过程中,总结了一套适合自身业务特点的用户画像方法论,及实践经验。本文将介绍为什么需要用户画像,以及如何做用户画像,并结合在阅文场景下所面……
阅读全文