搜索系统中的纠错问题 2022年3月15日 CS 的陋室 纠错是搜索引擎中一个非常有特色的模块,对用户输入的内容进行改写从而让用户得到正确的结果,有的时候也会带有一些惊喜度,所以纠错技术是一个搜索体验的加分项,近期突然对这块有兴趣,所以就了解了一下。 (学习周报本周停,学习内容都在这了) 纠错技术的背景 人非圣贤,孰能无过,别说是搜索…… 阅读全文
苏宁苏宁易购订单搜索系统架构及实现 2022年3月15日 背景 随着苏宁易购平台规模的飞速发展,平台的订单量呈现指数级的增长,存储容量已达 TB 级,订单量更是到了万亿级别,尤其在双 11 大促流量洪峰的场景下,面临两个挑战: 1、如何存储如此巨大的数据量 2、如何提供高并发、低延迟、多维度的检索服务 传统关系型数据库无法支撑多维度的模糊检索,为此,我们选…… 阅读全文
数值索引以及空间索引方案 2022年3月15日 要解决的问题 范围查询 在一个二维平面上,有很多点,给定一个矩形,怎么快速的将落在矩形中的点找出来? 这个问题还可以推广到任意维度,一维就是区间查询,三维就是在长方体内部。 近邻查询 离我最近的餐馆有哪些? 这个问题可以抽象成二维空间中,要找出距离某个点最近的点的集合。 一维的场景 这个场景非常…… 阅读全文
和假设检验流量分配 2022年3月15日 我们观测到的值,并不是我们需要的参数的真实值,而是真实值的估计(举个例子,平均值和期望);这也就意味着,估计可能是不准确的,ABtest的结果可能是错误的。直观上说,样本越多,我们可能犯错的概率越小。我们梳理了这块儿的知识,做一个学习总结。 实际业务中,我们定量下面几个问题: 1)A…… 阅读全文
技术招聘商业智能搜索召回体系搭建 2022年3月15日 作者: 58技术 曹冉冉 稿 01 背 景 58招聘过去的搜索召回逻辑主要基于类目体系,用户在输入关键词后,会跳转关键词对应的二级类,召回该二级类下的帖子。严格的类目限制导致很多符合的信息无法被召回,商业帖子填充率较低。同时,在58招聘蓝领为主的业务特点下,B&C端用户本身均有跨类需求,…… 阅读全文
百度搜索中台海量数据管理的云原生和智能化实践 2022年3月15日 导读:百度搜索中台将搜索核心能力赋能阿拉丁(百度搜索特型结果)、垂直领域搜索、应用内搜索等场景,支撑了数百个检索场景、百亿级内容数据的检索。我们通过智能化的设计理念,在容量自动调整、数据按需存储等方面取得了效率和成本的显著收益,并通过进阶云原生的设计,在海量数据和海量检索方面实现…… 阅读全文
美团深度学习在搜索业务中的探索与实践 2022年3月15日 本文根据美团高级技术专家翟艺涛在2018 QCon全球软件开发大会上的演讲内容整理而成,内容有修改。 引言 2018年12月31日,美团酒店单日入住间夜突破200万,再次创下行业的新纪录,而酒店搜索在其中起到了非常重要的作用。本文会首先介绍一下酒店搜索的业务特点,作为O2O搜索的一种,…… 阅读全文
淘宝搜索模型核心技术用户建模篇 2022年3月15日 文章作者:龙楚、丹鸥、晨宁、元涵 内容来源:阿里机器智能 导读: 用户建模是搜索与推荐模型的核心技术。我们力求从实际应用出发,和大家分享我们在搜索场景中用户建模的一些实践经验。同时将我们所观察到的现象、问题写出来,欢迎大家多讨论交流。 01背景与意义 用户建模是搜索与推荐模型的核心技术。淘…… 阅读全文
如何构建用户画像打用户行为标签 2022年3月15日 本文转载自 机器学习与人工智能 公众号 用户画像中用户行为标签是很重要的一块内容,这篇详细讲讲如何打行为标签。 数据仓库 用户画像的应用流程从原始的数据输入到模型应用可分为5块(图1),包括将操作型环境数据经ETL后集中存储在数据仓库,之后经过对数据的建模、挖掘、分析建立用户画像模型,最终…… 阅读全文
有赞搜索引擎从到技术解析 2022年3月15日 分享嘉宾: 毛夏君 老师 内容来源: DataFun AI Talk《搜索引擎从0到1》 出品社区: DataFun 今天主要分享的是一些搜索工程方面的意见,首先介绍下一个完整的搜索引擎是由哪几部分组成的,然后是搜索内部文件的读和写,最后是搜索系统中主要的核心要点分析以及对应的案例分析。最后是有赞方面的经验分享,和我们所做…… 阅读全文