年阿里沉淀出怎样的搜索引擎 2022年3月15日 简介: 阿里妹导读:搜索引擎是阿里的10年+沉淀,具有很高的技术/业务/商业价值。1688很多场景都借助了搜索中台的能力,基于此,以1688主搜为例介绍搜索全链路知识点,希望对你有所借鉴,有所启发。 一、整体架构 搜索引擎分为数据源聚合(俗称dump)、全量/增量/实时索引构建及在线服…… 阅读全文
计算广告中主要模块策略及其场景上篇 2022年3月15日 Vency不二 本文是我最近学习的一个总结,之前的文章多是和功能特别是广告主界面有关,而本篇文章则是和策略有关。在文章会讲述计算广告(主要是DSP)中的主要模块、用到的策略及其场景。希望大家能和我一样,在了解广告业务的同时,还能对策略的设计有一定了解,总结出一些通用的方法。 本文分三…… 阅读全文
京东搜索在线学习探索实践 2022年3月15日 文章作者:刘露、张颖、段学浩、王东旭 内容来源:京东算法架构 出品平台:DataFunTalk 导读: 随着京东零售搜索业务的快速发展,对数据的时效性要求越来越高,要求搜索模型有捕捉更实时信号的能力,在线学习体现了业务对模型时效性的追求,希望能根据在线系统反馈的数据实时得对模型进行调整,…… 阅读全文
浅谈有赞搜索质量保障体系 2022年3月15日 作者:张家瑜 部门:业务中台/测试开发 前言 有赞搜索中台的前身是ES中间件,并没有一个中台的概念,相应的就会有一个问题,业务接入搜索场景的时候还需要为此投入开发资源同步搜索设计,一个需求上线往往耗时很久,重复性工作较多,所以就有了后来的搜索中台的成立,将搜索完整链路的复杂性折叠成一个…… 阅读全文
阿里如何实现秒级百万搜索离线大数据平台架构解读 2022年3月15日 2018-09-17 阿里技术 背景 什么是搜索离线? 一个典型的商品搜索架构如下图所示,本文将要重点介绍的就是下图中的离线数据处理系统(Offline System)。 何谓离线?在阿里搜索工程体系中我们把搜索引擎、在线算分、SearchPlanner等ms级响应用户请求的服务称之为“在线”服务;与之相对应…… 阅读全文
前深度学习时代预估模型的演化之路 2022年3月15日 转载自: 王喆 在互联网永不停歇的增长需求的驱动下,CTR预估模型(以下简称CTR模型)的发展也可谓一日千里,从2010年之前千篇一律的 逻辑回归(Logistic Regression,LR),进化到 因子分解机(Factorization Machine,FM)、 梯度提升树(Gradie…… 阅读全文
跨境电商如何使用交互行为类型进行可解释推荐 2022年3月15日 浅梦的学习笔记 关注专栏写文章 “ 本文介绍了跨境电商Etsy如何利用用户历史交互行为的类型(如浏览,喜欢,收藏,加购,购买等)来完善物品的embedding表示,并进行可解释推荐。在离线和在线实验中均验证了引入交互类型信息后对于建模用户行为的准确性有提升。 ” 背景和介绍 工业级的推荐系统…… 阅读全文
效果工具链之运营平台篇 2022年3月15日 来源: 贝壳智搜 在数据驱动、智能化浪潮中,工程和算法往往并行不悖。效果工具链贯穿了所有效果优化类业务,做到 对优化流程的追踪、作业行为管控。作为效果优化系列的开篇文章,本篇旨在从 工程角度 介绍运营平台 重塑作业流程 的实施思路。除此篇之外,还包含算法迭代系统篇、搜索策略篇。 1.业务背景 随着…… 阅读全文
推荐系统遇上深度学习十一神经协同过滤原理及实战 2022年3月15日 作者: 石晓文,中国人民大学信息学院在读研究生 个人公众号:小小挖掘机(ID:wAIsjwj) 好久没更新该系列了,最近看到了一篇关于神经协同过滤的论文,感觉还不错,跟大家分享下。 论文地址: https://www.comp.nus.edu.sg/~xiangnan/papers/ncf.pdf 1、Neural Collaborative Filtering 1.1 背景 本文讨论的主要是隐性反馈协同过滤解决方案,先来明确两个概念:显性反馈…… 阅读全文
今日头条搜索品质优化端到端篇 2022年3月15日 叶航 字节跳动技术质量 稿 导览 为了提升头条端上的搜索性能体验,我们从19年3/4双月开始投入专门的人力做品质优化,通过这段时间的持续投入,搜索整体的性能体验有了明显的提升,基本上与竞品对齐。中间踩过很多坑,也收获了一些经验,这里做一个总结分享,欢迎大家拍砖交流~ 为了方便阅读,整体的介…… 阅读全文