2022年3月15日
作者: 58技术 曹冉冉 稿 01 背 景 58招聘过去的搜索召回逻辑主要基于类目体系,用户在输入关键词后,会跳转关键词对应的二级类,召回该二级类下的帖子。严格的类目限制导致很多符合的信息无法被召回,商业帖子填充率较低。同时,在58招聘蓝领为主的业务特点下,B&C端用户本身均有跨类需求,……
阅读全文
2022年3月15日
文章来源 http://kubicode.me/2018/09/19/Deep+Learning/GRU4REC-Session-Based-Recommendation/ 前言 用户在互联网应用上的绝大部分的行为都是可以用一个序列来表示,比如购物、听音乐、看feed流等,用式子来表示就是: {x_1,x_2,x_3,..,x_N} -> x_{N+1} 因此对于这个序列如何建模来获取整个用户的意图行为至关重要,而之前传统的ML只能基于统计或者经验的方式来尽量抽取这些序列信息,并无法hold整个序列,……
阅读全文
2022年3月15日
作者: 蘑菇先生学习记 大规模特征向量检索算法总结 (LSH PQ HNSW) 本篇文章主要介绍KDD 2020 Applied Data Science Track Papers中的一篇来自Facebook的语义检索文章,Embedding-based Retrieval in Facebook Search。关于样本、模型、训练等细节可以参考:负样本为王:评Facebook的向量化召回算法。本文重……
阅读全文
2022年3月15日
优步最近推出了一项新功能:UberEats 上的广告。这种新能力带来了 Uber 需要解决的新挑战,例如广告拍卖、竞标、归因、报告等系统。本文重点介绍我们如何利用开源技术构建 Uber 的第一个“近实时”恰好一次事件处理系统。我们将深入了解我们如何实现一次性处理以及事件处理作业的内部工作原理的细节。 对……
阅读全文
2022年3月15日
作者:桑海龙 AICUG人工智能社区 浏览器不支持该媒体的播放 :( 导读: 在58同城C端用户和B端商家IM微聊在线沟通场景下,我们应用对话机器人打造了商家智能聊天助手,对话机器人通过与C端用户沟通获取商机反馈给B端商家。在人机对话过程中我们需要识别出电话、地址、时间、服务对象等商机信息。……
阅读全文
2022年3月15日
导读:百度搜索中台将搜索核心能力赋能阿拉丁(百度搜索特型结果)、垂直领域搜索、应用内搜索等场景,支撑了数百个检索场景、百亿级内容数据的检索。我们通过智能化的设计理念,在容量自动调整、数据按需存储等方面取得了效率和成本的显著收益,并通过进阶云原生的设计,在海量数据和海量检索方面实现……
阅读全文
2022年3月15日
分享嘉宾: 鞠剑勋携程旅游度假AI NLP负责人 编辑整理: 金媛 内容来源: AI先行者大会《旅游知识图谱的构建和应用》 出品社区: DataFun 注:欢迎转载,转载请注明出处。 本文首先介绍了什么是旅游知识图谱,然后就旅游知识图谱的架构,构建,应用和未来几个方面展开讨论。 1. 旅游知识图谱 首先简单介绍什么是知……
阅读全文
2022年3月15日
本文根据美团高级技术专家翟艺涛在2018 QCon全球软件开发大会上的演讲内容整理而成,内容有修改。 引言 2018年12月31日,美团酒店单日入住间夜突破200万,再次创下行业的新纪录,而酒店搜索在其中起到了非常重要的作用。本文会首先介绍一下酒店搜索的业务特点,作为O2O搜索的一种,……
阅读全文
2022年3月15日
原文: https://zhuanlan.zhihu.com/p/58508137 作者: 青烟雨后 前言 在实际项目或者刷竞赛的时候,经常会遇到训练数据非常大导致一些算法实际上不能操作的问题。比如在广告行业中,因为DSP的请求数据量特别大,一个星期的数据往往有上百G,这种级别的数据在训练的时候,直接套用一些算法框架是没办法训练的,基本上在特征工程的阶段就一筹……
阅读全文
2022年3月15日
作者: 梁尔舒,李昀晖 写在前面 我们之前应该都了解链表求交、求并的算法,但是很少在实际工作中见过这些算法是怎么体现的,解决了哪些场景下的问题,其实lucene解决链表求交并的算法非常漂亮。最近因为工作中需要排查线上总是出现某些检索DSL执行比较慢,在网上到处找底层具体执行的资料,发现……
阅读全文