全文搜索引擎选还是 2022年3月15日 转载自 大快搜索 什么是全文搜索 什么是全文搜索引擎?百度百科中的定义: 全文搜索引擎是目前广泛应用的主流搜索引擎。它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找…… 阅读全文
机器学习模型评估与超参数调优详解 2022年3月15日 Datawhale干货 作者:李祖贤 深圳大学,Datawhale高校群成员 当我们建立好了相关模型以后我们怎么评价我们建立的模型的好坏以及优化我们建立的模型呢?那本次分享的内容就是关于机器学习模型评估与超参数调优的。本次分享的内容包括: 用管道简化工作流 使用k折交叉验证评估模型性能 使用…… 阅读全文
知乎搜索文本相关性与知识蒸馏 2022年3月15日 分享嘉宾:申站 知乎 算法工程师 编辑整理:许宴铭 出品平台:DataFunTalk 导读: 大家好,我是申站,知乎搜索团队的算法工程师。今天给大家分享下知乎搜索中文本相关性和知识蒸馏的工作实践,主要内容包括: 知乎搜索文本相关性的演进 BERT在知乎搜索的应用和问题 知识蒸馏及常见方案 知乎搜索在…… 阅读全文
搜索与推荐中的深度学习匹配之搜索篇 2022年3月15日 作者: 黄冠 讲真,很久没看过能让我这么兴奋的资料了,这个tutorial https://www.comp.nus.edu.sg/~xiangnan/sigir18-deep.pdf 简直就像一个博士论文,能让我对这个方向有足够深入的了解。而我最近又恰好从事这个方向,恰好也是落地到搜索引擎和推荐系统中,刚看到这个tutorial的时候,简直开心得不要不要的。 本篇blog的纲要: part-1 搜索和推荐…… 阅读全文
机器学习中的隐私保护 2022年3月15日 分享嘉宾:郭夏玮 第四范式 资深研究员 编辑整理:蒋瑞尧 内容来源:第四范式 | 先荐 出品平台:DataFun 导读: 近年来,随着 GDPR 通用数据保护条例出台以及一些互联网公司数据隐私泄漏等事件的发生,数据隐私的保护问题在行业应用中备受关注。与数据密切相关的机器学习算法的安全性成为一个巨大挑战。本文…… 阅读全文
中文用什么中文自然语言处理的完整机器处理流程 2022年3月15日 虽然同为人类自然语言,但是由于英文和中文其语言自身的特点,导致中文和英文分词是有差别的。 很多读者在后台留言,提到了结巴分词,并要求我们出一些关于中文自然语言处理的内容。所以本禅师就找到了这方面很有研究的宿永杰。 宿永杰现就职于某知名互联网公司担任数据挖掘工程师,CSDN 博客专家,P…… 阅读全文
在的探索与实践 2022年3月15日 分享嘉宾:江云胜@Hulu 编辑整理:许晏铭 出品平台:DataFunTalk 导读: Hulu是美国领先的互联网视频流媒体平台,拥有大量的电影、电视剧等视频资源,对这些内容的理解和表示是Hulu的一个重要研究方向。Content Embedding技术将内容表示为向量,以利于后续算法、模…… 阅读全文
机器学习模型的可解释性 2022年3月15日 文章作者:Leoc 腾讯 编辑整理:zizhewang ( 汪子哲 ) 内容来源:腾讯技术工程 出品平台:DataFunTalk 导读: 模型可解释性方面的研究,在近两年的科研会议上成为关注热点,因为大家不仅仅满足于模型的效果,更对模型效果的原因产生更多的思考,这样的思考有助于模型和特征的优化,更…… 阅读全文
万字长文解读电商搜索如何让你买得又快又好 2022年3月15日 文章作者:姚凯飞 Club Factory 推荐算法负责人 内容来源:作者授权发布 出品社区:DataFun 注:欢迎转载,转载请注明出处。 一. 概述 一个产品的搜索功能,是用户快速触达所需信息的通道,起到了引导用户走向的重要作用;优秀的产品必然有成熟、体验良好的搜索功能。 国内几个大型电商公司基本每日都有较大的流…… 阅读全文
搜狐新闻推荐算法原理呈现给你的都是你所关心的 2022年3月15日 导读 在当前这个移动互联网时代,各种信息内容爆炸,面对海量数据,用户希望在有限的时间和空间内,找到自己感兴趣的内容,这就是推荐需要解决的问题。接下来主要讲解新闻推荐的算法原理。 01.新闻推荐算法架构 新闻算法的核心主要分为两个阶段:召回阶段(retrieval)和排序阶段(ranki…… 阅读全文