查询原理 2022年3月15日 本文转载自 阿里云栖社区 前言 Lucene 是一个基于 Java 的全文信息检索工具包,目前主流的搜索系统Elasticsearch和solr都是基于lucene的索引和搜索能力进行。想要理解搜索系统的实现原理,就需要深入lucene这一层,看看lucene是如何存储需要检索的数据,以及如何完成高效的数据…… 阅读全文
查询性能调优实践亿级数据查询毫秒级返回 2022年3月15日 1、概述 本文简要描述ES查询性能的优化过程。忽略很多细节,其实整个过程并不顺利,因为并没有一个明确的指引,教你怎么做就能让性能大幅提升。很多时候不同业务有不同的场景,还是需要自己摸索一番。比如用filter过滤取代query查询,明明官方文档说filter速度更快。但应用到我们业…… 阅读全文
贝壳找房商业化算法中台架构实践 2022年3月15日 分享嘉宾:彭克炼 贝壳 资深工程师 编辑整理:马瑶 出品平台:DataFunTalk 导读: 随着贝壳流量的日渐增长,贝壳商业化细分场景越来越丰富,公司对业务迭代和效果优化的效率有了更高的要求,贝壳商业化策略算法中台的架构也在不断的进行调整和升级。本文将围绕贝壳商业化策略算法中台的架构演进过…… 阅读全文
万字长文解读电商搜索如何让你买得又快又好 2022年3月15日 文章作者:姚凯飞 Club Factory 推荐算法负责人 内容来源:作者授权发布 出品社区:DataFun 注:欢迎转载,转载请注明出处。 一. 概述 一个产品的搜索功能,是用户快速触达所需信息的通道,起到了引导用户走向的重要作用;优秀的产品必然有成熟、体验良好的搜索功能。 国内几个大型电商公司基本每日都有较大的流…… 阅读全文
搜你所想之用户搜索意图识别 2022年3月15日 本文是“达观数据技术主题月“5 月 12 日大数据杂谈社群分享内容整理。 大家晚上好,很高兴在这个美好的周末的晚上来到这里给大家做分享~ 也非常感谢 infoq 平台提供的这次机会,分享我们达观数据在垂直搜索引擎,尤其在用户查询意图分析挖掘方面的一些经验。首先自我介绍一下,我是达观数据的联合创始人 & 技术…… 阅读全文
微博广告分层实验平台架构实践 2022年3月15日 版权声明 作者:李铁牛 本文为InfoQ原创投稿。 移动互联网广告基于大数据,实现广告的精准人群定向投放和效果评估,并借助于不可胜数的广告策略,控制着广告的实时投放,让数据驱动型的移动互联网广告沿着站方、用户、广告主三者共赢的目标不断前进。 大数据驱动使得效果指标的量化评估成为了可能。为…… 阅读全文
搜索中的扩展技术 2022年3月15日 丁香园大数据 NLP 前言 最近,我司各条业务线对于搜索优化的需求日益增多,NLP 组也将对搜索业务给予更多的工作支持。后续分享,我们会关注过往的知识图谱、短本文理解等相关技术如何落地到搜索业务中。 影响搜索结果的因素有很多,包括对 短文本的正确理解(实体词识别、纠错、意图分析等)、 长文本良好结…… 阅读全文
互联网智能广告系统简易流程与架构 2022年3月15日 很多朋友估计没有做过这一块,争取最简洁的语言描述清楚。 一、业务简述 从业务上看 整个智能广告系统,主要分为: 1) 业务端:广告主的广告后台 2) 展现端:用户实际访问的页面 业务端, 广告主 主要有两类行为: 1) 广告设置行为:例如设置投放计划,设置地域,类别,关键字,竞价等 2) 效果查看行为:例如…… 阅读全文
回顾爱奇艺搜索排序模型迭代之路 2022年3月15日 分享嘉宾: 陈英傑** 爱奇艺 研究员** 编辑整理: 孙锴 内容来源: AI先行者大会《爱奇艺搜索排序模型迭代之路》 出品社区: DataFun 注:欢迎转载,转载请注明出处。 一、摘要 本次分享内容为爱奇艺在做视频搜索时,遇到的真实案例和具体问题;以及面对这些问题的时候,我们的解决方案。这次分享的ppt针对一线…… 阅读全文
在京东搜索实时中的应用实践 2022年3月15日 1、前言 本文讨论了京东搜索在实时流量数据分析方面,利用Apache Flink和Apache Doris进行的探索和实践。流式计算在近些年的热度与日俱增,从Google Dataflow论文的发表,到Apache Flink计算引擎逐渐站到舞台中央,再到Apache Druid等实时分析型…… 阅读全文