2022年3月15日
张俊林 推荐系统几乎已经深入到人们生活的方方面面,其背后的算法也在不断地迭代更新。FM 和 FFM 模型是最近几年提出的模型,拥有在数据量较大并且特征稀疏的情况下,仍然能够得到优秀的性能和效果的特性。 新浪微博 AI Lab 资深算法专家张俊林,在 2018 年全球人工智能与机器学习大会 AICon 的演讲中,着重探讨了几种排……
阅读全文
2022年3月15日
转载自 大快搜索 什么是全文搜索 什么是全文搜索引擎?百度百科中的定义: 全文搜索引擎是目前广泛应用的主流搜索引擎。它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找……
阅读全文
2022年3月15日
作者:杨森 01 导读 语音是58同城用户之间的重要沟通媒介,58同城C端用户和B端用户之间可以通过电话(隐私通话)、网络音视频通话(微聊)建立连接,这些场景下产生的语音数据有巨大的挖掘价值。本次议题主要分享语义标签的文本挖掘技术,首先介绍使用主动学习技术解决冷启动时样本少的问题,然后对……
阅读全文
2022年3月15日
分享嘉宾:潘国庆@携程 文章整理:王钊 内容来源:Flink Forward 来源: DataFunTalk 导读: 将实时计算和深度学习相结合、可解决某种特定的业务场景。本次将分享基于tensorflow和flink构建携程的实时智能检测平台。 今天分享的主要内容分为四个部分: 1. Background 2. What is Prophet 3. AI and Real Time 4. Challenges and Future 每个公司都会有监控……
阅读全文
2022年3月15日
Datawhale干货 作者:李祖贤 深圳大学,Datawhale高校群成员 当我们建立好了相关模型以后我们怎么评价我们建立的模型的好坏以及优化我们建立的模型呢?那本次分享的内容就是关于机器学习模型评估与超参数调优的。本次分享的内容包括: 用管道简化工作流 使用k折交叉验证评估模型性能 使用……
阅读全文
2022年3月15日
导读:「以客户为中心,技术为产品服务」是爱番番线索管家团队一贯遵循的原则。技术架构规划首先应该围绕业务诉求展开,用合理的技术赋能产品,产品在不断的演进中又对技术提出更高的标准和要求。作为爱番番PV最高的页面,本文将详细介绍线索列表如何从快速交付的刀耕火种原始状态,逐步走向“高可用……
阅读全文
2022年3月15日
分享嘉宾:申站 知乎 算法工程师 编辑整理:许宴铭 出品平台:DataFunTalk 导读: 大家好,我是申站,知乎搜索团队的算法工程师。今天给大家分享下知乎搜索中文本相关性和知识蒸馏的工作实践,主要内容包括: 知乎搜索文本相关性的演进 BERT在知乎搜索的应用和问题 知识蒸馏及常见方案 知乎搜索在……
阅读全文
2022年3月15日
作者: 黄冠 讲真,很久没看过能让我这么兴奋的资料了,这个tutorial https://www.comp.nus.edu.sg/~xiangnan/sigir18-deep.pdf 简直就像一个博士论文,能让我对这个方向有足够深入的了解。而我最近又恰好从事这个方向,恰好也是落地到搜索引擎和推荐系统中,刚看到这个tutorial的时候,简直开心得不要不要的。 本篇blog的纲要: part-1 搜索和推荐……
阅读全文
2022年3月15日
本文转载自 阿里云栖社区 前言 Lucene 是一个基于 Java 的全文信息检索工具包,目前主流的搜索系统Elasticsearch和solr都是基于lucene的索引和搜索能力进行。想要理解搜索系统的实现原理,就需要深入lucene这一层,看看lucene是如何存储需要检索的数据,以及如何完成高效的数据……
阅读全文
2022年3月15日
分享嘉宾:郭夏玮 第四范式 资深研究员 编辑整理:蒋瑞尧 内容来源:第四范式 | 先荐 出品平台:DataFun 导读: 近年来,随着 GDPR 通用数据保护条例出台以及一些互联网公司数据隐私泄漏等事件的发生,数据隐私的保护问题在行业应用中备受关注。与数据密切相关的机器学习算法的安全性成为一个巨大挑战。本文……
阅读全文