2022年3月15日
这次的系列文章将会介绍 NLP 领域语言模型及词向量表示的发展史,原理篇会从远古时代的 one-hot 出现讲到时代新星 bert 及其改进,同时后续的实践篇将会介绍预训练模型在房产领域的工业实践应用,带你填上一个个的大坑。话不多说,操练起来~ 语言模型及词向量 何为语言模型?这是一个要贯穿整篇文章的问题。所谓语言模……
阅读全文
2022年3月15日
融慧金科 AI Lab团队 稿 1.背景介绍 书籍推荐 首先,想向各位读者推荐一本电子书籍《Interpretable Machine Learning》,其原因有两个: 1.该书作者从2017年首次在网络发布本书之后至今一直在持续更新,在github上可以看到其最新的更新时间是今年的6月30日。作者这样的科研……
阅读全文
2022年3月15日
在诸多新技术付诸应用之后,越来越多的技术从业者开始发现,似乎摩尔定律已经开始失灵了,两年的周期远远跟不上技术和信息爆炸的速度。但与此同时,我们却发现另一个定律出乎意外的开始在科技圈里盛行,那就是丛林法则。狼性文化也好,剩者为王也好,云计算、人工智能、再到区块链等技术无不在彰显一个……
阅读全文
2022年3月15日
Manish Rai Jain 2019 年 2 月 26 日 转载自: https://infoq.cn/article/CdYJLgPbEF-MqMIE9Cf7 近日,前谷歌开发者、现 Dgraph 创始人 Manish Rai Jain 撰文揭秘了谷歌内部在知识图谱领域的探索和发展。他以一个开发和技术前驱者的视角论述了“为什么谷歌需要一个知识图谱系统”,并详细披露了知识图谱在谷歌的探索尝试的历程。虽然由于种种原因,他当时的知识图谱项目最终被放弃,但整……
阅读全文
2022年3月15日
分享嘉宾:李祖定 58 同城 算法架构师 编辑整理:郭嘉伟 内容来源:58 推荐系统技术沙龙 出品平台:DataFunTalk 导读: 招聘业务是多行为场景,用户需求和交互周期短、行为稀疏。本次分享基于业务挑战,将介绍代价敏感、向量检索等技术在招聘深度召回中的应用,最后总结实践中的教训与心得。 主要内……
阅读全文
2022年3月15日
作者: 石塔西 推荐道 前言 研究推荐算法的一大痛点是什么?不是文章太少,而是文章太多,信息爆炸。每年KDD, SIGIR, CIKM上有那么多中外的王婆一起卖瓜,各种各样的NN、FM、Attention满天飞,其中不乏实打实的干货,更不缺乏湿漉漉的灌水文,让人不知道哪个方法才是解决自己问题的灵丹妙药……
阅读全文
2022年3月15日
作者:bellen,腾讯云大数据研发工程师。 腾讯云 Elasticsearch 被广泛应用于日志实时分析、结构化数据分析、全文检索等场景中,本文将以情景植入的方式,向大家介绍与腾讯云客户合作过程中遇到的各种典型问题,以及相应的解决思路与方法,希望与大家一同交流。 背景 某中型互联网公司的游戏业务,使用了腾讯云的……
阅读全文
2022年3月15日
孙伟@Dell Flink 中文社区 摘要:本文整理自 Dell 科技集团高级软件研发经理孙伟在 4 月 17 日 上海站 Flink Meetup 分享的《Iceberg 和对象存储构建数据湖方案》。内容包括: 数据湖和 Iceberg 简介 未来规划 演示方案 存储优化的一些思考 一、数据湖和 Iceberg 简介 1. 数据湖生态 如上图所示,对于一个成熟的数据湖生态而言: 首先我们认……
阅读全文
2022年3月15日
来源:美团点评技术团队 导读:美团搜索排序是一个典型的多业务混合排序建模问题,这种多业务场景搜索存在很多挑战。本文聚焦到店商家多业务场景的多业务排序建模优化工作,希望能对从事相关工作的同学有帮助。 引言 排序流程简介 多业务建模实践 多业务配额模型 多业务排序模型 总结和展望 参考资料 作者简介 引……
阅读全文
2022年3月15日
相比云侧智能,端智能具有低延时、保护数据隐私、节省云端计算资源等显著优势。 背景 近年来,以深度学习为代表的新一代人工智能技术得到了快速发展和广泛应用,模型训练和模型推断基本都在云侧完成。但随着移动设备算力的提升、模型压缩技术的成熟,模型推断在终端设备运行成为可能,端智能(On-De……
阅读全文