2022年3月14日
分享嘉宾:王桐 阿里巴巴 资深算法专家 编辑整理:杨晓磊 本来集团 出品平台:DataFunTalk 导读: 本次分享的主题是阿里在智慧供应链预测算法上的探索。供应链里最大的挑战是不确定性,决策和优化的核心诉求就是围绕着不确定性做出最优的决策。对付供应链的不确定性有很多的方式,预测是阻挡供应链……
阅读全文
2022年3月14日
分享嘉宾: 刘力云@贝壳找房 内容来源: Flink中文社区 摘要: 贝壳找房大数据平台实时计算负责人刘力云带来的分享内容是贝壳找房的实时计算演进之路,内容如下: 发展历程 平台建设 实时数仓及其应用场景 事件驱动场景 未来规划 一、发展历程 首先是平台的发展历程。最早是因为业务方在实时计算方面有比较多……
阅读全文
2022年3月14日
构造 IndexWriter 对象(七) 构造 IndexWriter 对象(六) 构造 IndexWriter 对象(五) 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本文承接 构造 IndexWriter 对象(七),继续介绍调用 IndexWriter 的构造函数的流程。 调用 IndexWriter 的构造函数的流程图 图 1: 生成对象 IndexFileDeleter 我们紧接上一篇文章,继续介绍剩余的流程点,下面先给出 IndexFileDeleter 的构造函数流程图……
阅读全文
2022年3月14日
原文地址 http://wangke.me/2017/07/17/youtube-recommendation-system/ 作者: 王科 作为全球最大的视频网站,YouTube的推荐系统如同Netflix,Amazon一样备受业内人士格外关注。本文对YouTube历年发表的推荐系统论文做了整理,希望从中理出一条值得借鉴的路线。 第一阶段,基于USER-VIDEO图游历算法,2008年[1]。 在这个……
阅读全文
2022年3月14日
58同城作为中国最大的分类信息网站,提供了房产、招聘、黄页和二手交易等多方面的生活服务信息,信息数据量和访问量逐年增长,列表页排序需求也时常变化。在这样的背景下,58搜索技术部使用C++语言自主研发了ESearch 搜索内核,取代之前使用的 Solr,大幅提高了性能和可定制性。 经过多……
阅读全文
2022年3月14日
大赛官网: http://meizu.baiducloud.top/ps/web/index.html 初赛内容:从图片中识别四则运算式,算式可能包含数字0~9、运算符+-*、括号()。并且,算式的长度固定为5或7,包含三个数字,两个运算符,0或1对括号。下面是几个样例: (4*8)+8 (0-2)+5 2*8-7 要求参赛者给出每张图片中的算式和运算结果。 训练集共100,000张图片,并附带标签。测试集共2……
阅读全文
2022年3月14日
Automaton 在介绍 Automation 类之前先介绍下有穷自动机的概念,有穷自动机分为确定型有穷自动机(DFA)跟不确定型有穷自动机(NFA)。由于本篇文章是为介绍 TermRangeQuery 作准备的,所以只介绍确定性有穷自动机。 确定型有穷自动机(Deterministic Finite Automaton) 这种自动机在读任何输入序列后只能处在一个状态中,术语“确定……
阅读全文
2022年3月14日
杨航@贝壳找房 近年来,深度学习算法在各领域大放异彩,各种端到端模型也日趋成熟。特别是在推荐算法领域,端到端模型几乎成了标配。端到端模型可以将特征工程融入到模型中,由模型自动化提取有效特征;也可以将各类网络结构融合到一起进行训练,根据数据特点进行深度拟合。本文探讨在贝壳经纪人流失预……
阅读全文
2022年3月14日
文末彩蛋:七月在线干货组最新升级的《2021大厂最新AI面试题 [含答案和解析, 更新到前105题]》免费送! 问题1:介绍逻辑回归,逻辑回归是一个分类算法,那么它是在回归什么呢? 逻辑回归是在数据服从伯努利分布的假设下,通过极大似然的方法,运用梯度下降法来求解参数,从而达到将数据二分类……
阅读全文
2022年3月14日
FixedBitSet FixBitSet 类在 Lucene 中属于一个工具类(Util),它的其中一个用途用来存储文档号,用一个 bit 位来描述(存储)一个文档号。该类特别适合存储连续并且没有重复的 int 类型的数值。最好情况可以用 8 个字节来描述 64 个 int 类型的值。下面通过介绍几个 FixBitSet 类的方法来理解这个类的存储原理。本篇文章纯属充数。。。直接看源……
阅读全文