2022年3月15日
以下文章来源于搜索与推荐Wiki ,作者Thinkgamer 其实在19年初的时候大概看了一下这篇论文,但当时其实理解的并不深,今天再读的时候发现这里边其实包含了很多东西,不仅是学术性的目标函数优化,也包括工程性的取舍和特征的构造。 本文分为两部分,第一部分主要介绍论文,第二部分谈从中……
阅读全文
2022年3月15日
赵健博,快手大数据架构团队的负责人 工作十年,跳槽三次,四份工作 毕业后加入百度 我是在北京邮电大学就读的本科,毕业后被保送到了中国科学院计算技术研究所,硕士期间主要从事的是计算机系统结构与操作系统的相关研究。上学时对 Linux Kernel 非常痴迷,也做些有意思的小项目,研究生毕业后,还想着继续做这块的……
阅读全文
2022年3月15日
作者丨陈家铭 学校丨中山大学硕士生 研究方向丨半监督深度图像分类 本文来源: PaperWeekly 协同训练 Co-training Co-training 是基于分歧的方法,其假设每个数据可以从不同的角度(view)进行分类,不同角度可以训练出不同的分类器,然后用这些从不同角度训练出来的分类器对无标签样本进行分类,再选出认为可信的无标签样本加入训练集……
阅读全文
2022年3月15日
作者 | 贺科学(晨末) 来源 | 阿里巴巴中间件团队 一、背景 1. 从事物的本质说起 事物本质就是内部的主要矛盾次要矛盾的演变过程,同时该演变过程受外界环境其他事物的相互关联和相互影响。在普遍的情况下,一个事物的生命周期,是它的主要矛盾、次要矛盾被解决的过程体现。如何分析问题本质,我们已经在 《「……
阅读全文
2022年3月15日
导读:据Gartner调研,应用开发需求的市场增长至少超过IT交付能力的5倍,预计到2025年,70%的新应用开发将使用低代码技术。我们需要在需求迭代越来越高频、创新能力要求越来越高的背景下,探索如何通过技术手段为业务开发降本增效提质做出突破,更高效的实现产品创新。百度搜索中台支……
阅读全文
2022年3月15日
本文介绍 GC 基础原理和理论,GC 调优方法思路和方法,基于 Hotspot jdk1.8,学习之后你将了解如何对生产系统出现的 GC 问题进行排查解决。 内容主要如下: GC 基础原理,涉及调优目标,GC 事件分类、JVM 内存分配策略、GC 日志分析等。 CMS 原理及调优。 G1 原理及调优。 GC 问题排查和解决思路。 GC 基础原理 GC 调……
阅读全文
2022年3月15日
分享嘉宾:杜宝坤 京东 资深算法专家 编辑整理:侯雅新 出品平台:DataFunTalk 导读: 对于AI飞速发展的今天来说,大规模的多维度、高质量的数据是其成功的关键要素,也是制约其进一步发展的重要瓶颈。随着大家对数据的重要性与隐私性的认知程度的不断提升,跨组织的数据的合作越来越谨慎,相关……
阅读全文
2022年3月15日
作者:Mihajlo Grbovic 编译:ronghuaiyang 英文原文: https://medium.com/airbnb-engineering/listing-embeddings-for-similar-listing-recommendations-and-real-time-personalization-in-search-601172f7603e 导读: 这是Airbnb的一篇经典文章的解读,使用房屋的嵌入来做搜索推荐,这篇文章也是KDD2018的best paper,思路很清楚:把房屋用嵌入向量来表示,两个技巧:全局正样本和市场内负采样,很有效,离线评估指标:预……
阅读全文
2022年3月15日
转载自 : 杉枫 量变引起质变,这个情况在分布式redis集群下发生的极其明显,当用redis集群规模很小、存取数据很小时,基本上不会遇到任何问题,但是当我们集群规模为数T,并且存在很多业务读写集群各种各样问题都会发生。 线上遇到过一个业务突然tp99飙升,并且性能持续变差,性能看着一点……
阅读全文
2022年3月15日
来源: 58技术 丁斌 导读 本文主要介绍如何基于Levenshtein和Damerau Levenshtein自动机技术高效地解决在搜索引擎系统中相似字符串快速查找问题的技术原理和操作实践。文中创造性地提出一种Damerau Levenshtein自动机的有效构建算法,并创造性地给出了利用……
阅读全文