2022年3月14日
2012 年创建的字节跳动,短短几年时间发展到估值接近千亿美元的互联网大鳄,拥有今日头条、抖音、西瓜视频等多个爆品 app,除了搭上了移动互联网的春风,其企业自身的核心竞争力也得到了极大的体现。因此,对其核心竞争力进行一定的分析,抓住对自身团队有益的核心逻辑,予以学习和实践就变得很有价值了……
阅读全文
2022年3月14日
配套PPT下载,请识别底部二维码关注社区公众号,后台回复【 上海NLP 】 分享嘉宾: 马宇峰** 阅文信息 内容挖掘平台技术负责人** 编辑整理: 赵世瑜 内容来源: DataFun AI Talk《NLP在阅文内容挖掘平台的应用场景与落地实践》 出品社区: DataFun 注:欢迎转载,转载请注明出处。 一、业务背景 网络文学的发展已……
阅读全文
2022年3月14日
摘要:在RocketMQ中,消息消费都是基于Pull消息方式,那么Push模式中又是如何实现Consumer端准实时消费的呢? 在上一篇—“消息中间件—RocketMQ消息消费(一)”中,已经简要地介绍了下RocketMQ中“Pull和Push两种消费方式的简要流程”以及“Push……
阅读全文
2022年3月14日
本文主要分享了今日头条推荐系统概览以及内容分析、用户标签、评估分析,内容安全等原理。 今天,算法分发已经是信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配,但同时,算法也开始面临质疑、挑战和误解。今日头条的推荐算法,从 2012 年 9 月第一版开发运行至今,已经经过四次大的调整和修改。……
阅读全文
2022年3月14日
以下文章来源于搜索与推荐Wiki ,作者Thinkgamer 文本特征在内容平台内使用的场景和方式更多,但并不等于说其在其他形式的平台中无用户之地,比如:电商平台中的商品标题、商品介绍、评论等,商品平台中视频标题、视频介绍、评论等。 利用文本数据可以做的事情很多,包括但不局限于:关键词……
阅读全文
2022年3月14日
这篇文章介绍 TieredMergePolicy,它是 Lucene4 以后的默认段的合并策略,之前采用的合并策略为 LogMergePolicy,建议先熟悉 LogMergePolicy 后再了解 TieredMergePolicy,这样对于两种合并策略的优缺点能一目了然,使得在不同业务使用对应的策略,其中两种合并策略最大的不同……
阅读全文
2022年3月14日
【AD】如何提升大数据行业影响力?给数据分析网[投稿],辐射50万大数据爱好者!什么是交叉验证法?它的基本思想就是将原始数据(dataset)进行分组,一部分做为训练集来训练模型,另一部分做为测试集来评价模型。 什么是交叉验证法?它的基本思想就是将原始数据(dataset)进行分组……
阅读全文
2022年3月14日
摘要: 本文由快手大数据架构团队负责人赵健博分享,主要介绍 Apache Flink 在快手的过去、现在和未来。内容包括: 为什么选 Flink Flink 在快手的发展 业务数据流 技术创新 未来计划 一、为什么选 Flink 大家好,我是赵健博,来自快手,目前负责快手大数据架构团队。今天很高兴可以和大家分享我们在 Flink 项目上的应用、改进与发展历程。……
阅读全文
2022年3月14日
问题1:介绍下什么是Word2vec 在介绍Word2Vec之前需要先理解Word Embedding,它是将无法直接计算的、非结构化的单词转化为可计算的、结构化的数据-向量; 那么什么是Word2Vec呢? Word2vec是 Word Embedding 的方法之一。他是2013年由谷歌的Mikolov提出了一……
阅读全文
2022年3月14日
搜索引擎如何工作? 信息检索已经发展的非常成熟了,应该所有人都不陌生。我有幸这几年接触过并且实际做过一些搜索引擎开发的工作,特此总结并分享给大家。实际上,一个成熟的搜索引擎是想当复杂的,比如百度的,就分nginx,vui,us,as,bs,da…..等等这些模块,当然……
阅读全文