2022年3月15日
搜索中的 Query 扩展技术 丁香园大数据NLP 一、前言 这一期我们继续来聊 Query扩展 的问题,在上一期我们梳理了目前Query扩展技术可以大致分为 相关性建模 和 翻译模型建模 两种思路。 (传送门:搜索中的Query扩展技术) 在介绍现有Paper工作的同时,结合我们自身场景,如果对文档能够构建概述……
阅读全文
2022年3月15日
原文发布于微信公众号 - 小小挖掘机(wAIsjwj) 原文发表时间:2018.04.22 16:14 1、原理 Deep&Cross Network模型我们下面将简称DCN模型: 一个DCN模型从嵌入和堆积层开始,接着是一个交叉网络和一个与之平行的深度网络,之后是最后的组合层,它结合了两个网络的输出。完整的网络模型如图……
阅读全文
2022年3月15日
文末免费送电子书:七月在线干货组最新 升级的《名企AI面试100题》免费送! 项目一:igel — 无需编写代码即可训练,测试和使用模型 一个令人愉悦的机器学习工具,可让您无需编写代码即可训练/拟合,测试和使用模型。 该项目的目标是为技术用户和非技术用户提供机器学习。 有时我需要一个工具,可以……
阅读全文
2022年3月15日
原文发布于微信公众号 - 小小挖掘机(wAIsjwj) 原文发表时间:2018.04.21 23:27 1、背景 在本系列第三篇文章中,在处理DeepFM数据时,由于每一个离散特征只有一个取值,因此我们在处理的过程中,将原始数据处理成了两个文件,一个记录特征的索引,一个记录了特征的值,而每一列,则代……
阅读全文
2022年3月15日
分享嘉宾:杨旭 阿里巴巴 资深算法专家 编辑整理:朱荣 导读: Alink是基于Flink流批一体的机器学习平台,提供一系列算法,可以帮助处理各种机器学习任务,比如统计分析、机器学习、实时预测、个性化推荐和异常检测。除了提供Java API也提供了PyAlink,可以轻松部署到单机及集群环境……
阅读全文
2022年3月15日
文末免费送电子书:七月在线干货组最新 升级的《名企AI面试100题》免费送! 问题1:SVM 的 优化函数公式怎么写,代价函数是什么? 线性可分支持向量机的最优化问题函数公式: 引入拉格朗日乘子,由拉格朗日对偶性可得代价函数如下: 问题2:随机森林是怎么回事,为什么树模型好用,为什么要发明随机……
阅读全文
2022年3月15日
分享嘉宾:王金海 趣头条 编辑整理:王彦 内容来源:Flink Forward Asia 出品平台:DataFunTalk 导读: 趣头条一直致力于使用大数据分析指导业务发展。目前在实时化领域主要使用 Flink+ClickHouse 解决方案,覆盖场景包括实时数据报表、Adhoc 即时查询、事件分析、漏斗分析、留存分析等精细化运营策略,整体响应 80%……
阅读全文
2022年3月15日
分享嘉宾:刘斌 360 资深算法工程师 编辑整理:赵勇 出品平台:DataFunTalk 导读: 360展示广告平台始终关注广告投放效果,围绕广告后续优化问题先后开发了多款产品。 随着产品规模的不断扩张,有关效果优化的新需求新问题不断产生。本文主要介绍了效果优化系统随业务发展的演进过程,聚焦如何使……
阅读全文
2022年3月15日
导读 在数据量日益增长的当下,传统数据库的查询性能已满足不了我们的业务需求。而Clickhouse在OLAP领域的快速崛起引起了我们的注意,于是我们引入Clickhouse并不断优化系统性能,提供高可用集群环境。本文主要讲述如何通过Clickhouse结合大数据生态来定制一套完善的……
阅读全文
2022年3月15日
原文: 爱奇艺产品技术团队 随着 UGC 内容爆发式增长,信息流产品占领越来越多的用户时间。爱奇艺作为国内领先的互联网视频媒体,承担了正确引导用户价值观的社会责任。所以识别和屏蔽低俗内容、做好风险内容控制、净化短视频生态是一项非常值得重视的工作。下面我们从技术的角度,以“软色情识别”为例,介……
阅读全文