丁香园基于的向量召回应用 2022年3月15日 丁香园大数据NLP 丁香园大数据 背景 随着BERT,GNN等模型在NLP领域的发展,DNN类模型的语义提取能力又得到进一步提升,我们对文本语义向量也有了更高的期待,期望语义向量或其他模型特征向量可以在召回段发挥更大作用;约2019年初,我们就尝试在推荐业务中引入基于Faiss的向量召…… 阅读全文
美团搜索中查询改写技术的探索与实践 2022年3月15日 杨俭 宗宇 谢睿等 美团技术团队 稿 1. 引言 在搜索场景中,由于用户搜索词Query和检索文本Document之间存在大量表述不一的情况,在文本检索框架下,此类文本不匹配导致的漏召回问题严重影响着用户的体验。对这类问题业界一般有两种方案:用户端拓展用户的查询词——即查询改写,或Documen…… 阅读全文
重叠实验框架更多更好更快地实验 2022年3月15日 Introduction Google是一个数据驱动型公司,这意味着所有对用户的改动的发布,都要决策者以相应的经验数据作为依据。这些数据大部分是由在线流量上的实验产生的。在web的语境下,一个实验是由一股流量(比如,用户的请求)和在这股流量上进行的相对对比实验的修改组成的。修改包括用户可见的修改(比如,…… 阅读全文
贝壳找房一镜到底们的原理及在贝壳搜索的实践 2022年3月15日 一、背景 在推荐系统、搜索排序、效果广告等场景中,点击率预估是十分重要的部分,CTR 算法也被誉为镶嵌在互联网技术上的明珠。在深度学习火热之前,除了简单的 LR 以外常用的算法类有:以决策树为主的 Boosting 算法;以因子分解为基础的 FM 算法。相对而言,树模型比较适合学习数值类的连续特征,而后者更适合学…… 阅读全文
美团点评智能搜索模型预估框架的建设与实践 2022年3月15日 朱敏 紫顺 乐钦等 美团技术团队 1. 背景 搜索优化问题,是个典型的AI应用问题,而AI应用问题首先是个系统问题。经历近10年的技术积累和沉淀,美团搜索系统架构从传统检索引擎升级转变为AI搜索引擎。当前,美团搜索整体架构主要由搜索数据平台、在线检索框架及云搜平台、在线AI服务及实验平台三大体…… 阅读全文
贝壳网贝壳搜索为什么能知道你想住哪 2022年3月15日 在NLP(自然语言处理)中,NER(命名实体识别)是很多应用的关键一步,江湖地位毫无争议,它的研究主体一般包括3大类(实体类、时间类和数字类)和7小类(人名、地名、机构名、时间、日期、货币和百分比)命名实体。贝壳找房作为中国最大的居住服务平台,有丰富的数据和合适的场景,所以该技术…… 阅读全文
深度学习在同城租房搜索排序的应用 2022年3月15日 导读:深度学习得益于良好的深层特征表达性,目前在视觉、文本、语音等领域获得了广泛的应用。搜索领域紧贴用户需求,作为深度学习商业变现最成功的路径之一,众多头部企业发展出了许多优秀的应用。58同城是国内最大的生活信息服务平台,涵盖房产、招聘、黄页、二手车等多个业务,在多个业务线的搜索…… 阅读全文
在美团搜索核心排序的探索和实践 2022年3月15日 美团点评技术团队 引言 美团搜索是美团App上最大的连接人和服务的入口,覆盖了团购、外卖、电影、酒店、买菜等各种生活服务。随着用户量快速增长,越来越多的用户在不同场景下都会通过搜索来获取自己想要的服务。理解用户Query,将用户最想要的结果排在靠前的位置,是搜索引擎最核心的两大步骤。…… 阅读全文
阿里电商搜索算法技术的演进 2022年3月15日 阿里妹导读:2018年9月28日,阿里电商搜索事业部迎来了一场以“搜·荐未来”为主题的技术峰会。 搜索与推荐算法经过多年的发展,从最初简单的统计模型,机器学习到形成完整的离线在线与实时的深度学习与智能决策体系,每年都有新的算法突破,帮助搜索与推荐的体验与效果取得大幅提升,成为驱动电…… 阅读全文
机器学习加持的体验搜索排序实践 2022年3月15日 作者:Mihajlo Grbovic 编译:ronghuaiyang 导读: 我们是如何为一个全新的双边市场来迭代的构建机器学习的搜索平台的,我们是如何帮助其成长的。 Airbnb 体验是由专业房东精心设计和引导的活动,提供不一样的当地场景和文化品味。每一次体验都要经过编辑团队的质量审查,然后才会发布到平台上。 我…… 阅读全文