2022年3月15日
目录 一、介绍 1.1 LSTM介绍 LSTM全称_Long Short-Term Memory_,是1997年就被发明出来的算法,作者是谁说了估计也记不住干脆就不说了(主要是我记不住,逃…) 经过这么多年的发展,基本上没有什么理论创新,唯一值得说的一点也就是加入了Dropout来对抗过拟合。真的是应了那句话呀: Deep……
阅读全文
2022年3月15日
康康 字节跳动技术团队 稿 本文整理自火山引擎开发者社区 Meetup 第四期同名演讲,主要为大家介绍了为什么要做 A/B 测试、火山引擎 A/B 测试系统架构及最佳实践。 为什么要做 A/B 测试 首先我们看一个案例。字节跳动有一款中视频产品叫西瓜视频,最早它叫做头条视频。为了提升产品的品牌辨识度,团队想给它起个更好的名字。……
阅读全文
2022年3月15日
今天给大家介绍一个知识图谱在贝壳找房的实践案例,一款基于KBQA(knowledge base question answering, KB-QA)的经纪人咨询助手应用。7月份我们图谱团队代表贝壳参加了知识图谱技术国家标准的制定研讨会《 知识图谱国家标准研讨会暨团体标准启动会成功召开》,之后受邀参与撰写知识图谱实践案例,这个案……
阅读全文
2022年3月15日
分享嘉宾:魏天闻 小米人工智能部 编辑整理:李淑娜 内容来源:DataFunTalk 导读: 小爱同学是小米公司开发的智能语音系统,已广泛应用在手机、手环、音箱、电视等电子产品中,并支持闲聊、问答、语音控制等多种语音交互场景。语音系统中语音内容识别 ( ASR ) 的精准性,是影响智能语音产品发展的关……
阅读全文
2022年3月15日
引言 俗话说有多少米,就下多大锅。在特征体系构建上,我们已经准备了很多米了,并且在线性模型 FTRL 上拿到了一些甜头。下一阶段我们换了锅,对模型进行了升级,从线性模型转为 end-to-end 的深度模型,并进行了多个版本的迭代,包括 pure deep 模型(Pure Adaptive L2 Model,PALM),引入实时点击和实时未点击行为(F……
阅读全文
2022年3月15日
前言 Apache Lucene是一个开源的高性能、可扩展的信息检索引擎,提供了强大的数据检索能力。Lucene已经发展了很多年,其功能越来越强大,架构也越来越精细。它目前不仅仅能支持全文索引,也能够提供多种其他类型的索引方式,来满足不同类型的查询需求。 基于Lucene的开源项目有很多,最知名……
阅读全文
2022年3月15日
上一篇文章中,我们介绍了在索引(index)阶段,Lucene 收集了跟点数据相关的信息,这些信息在 flush 阶段会被读取,用于生成索引文件。dim&&.dii,从本文开始介绍索引文件。dim&&.dii 生成的详细过程,如图 1 所示,另外阅读本文中需要前置知识……
阅读全文
2022年3月15日
分享嘉宾:马金韬 爱奇艺 数据中台负责人 编辑整理:陈国梅 出品平台:DataFunTalk 导读: 随着市场对数据价值的认可,促进了数据在各行各业的爆发式增长,以及大数据设施的快速演化,同时也带来了不少新的数据问题;解决这些问题,发挥更大的数据价值,成为了各大公司的重点工作。爱奇艺通过数据……
阅读全文
2022年3月15日
作者:morningchen,腾讯 TEG 后台开发工程师 答疑问题链接: https://elasticsearch.cn/article/13768 Elasticsearch( ES )是一款功能强大的开源分布式实时搜索引擎,在日志分析(主要应用场景)、企业级搜索、时序分析等领域有广泛应用,几乎是各大公司搜索分析引擎的开源首选方案。 Tencent ES 是内核级深度优化的 ES 分支,持续……
阅读全文
2022年3月15日
原文发布于微信公众号 - 小小挖掘机(wAIsjwj) 原文发表时间:2018-04-15 1、背景 特征组合的挑战 对于一个基于CTR预估的推荐系统,最重要的是学习到用户点击行为背后隐含的特征组合。在不同的推荐场景中,低阶组合特征或者高阶组合特征可能都会对最终的CTR产生影响。 之前介绍的因……
阅读全文