2022年3月15日
分享嘉宾:周晖栋 bilibili 编辑整理:宋灵城 贝壳找房/东南大学 出品平台:DataFunTalk 导读: 本文主要介绍Flink实时计算在bilibili的优化,将从以下四个方面展开:① Flink-connector稳定性优化;② Flink sql优化;③ Flink-runtime优化;④ 对未来的展望。 01……
阅读全文
2022年3月15日
分享嘉宾:kevinshuang、fivenwu 编辑整理:张振、于洋 出品平台:DataFunTalk 导读: 腾讯音乐娱乐集团 ( TME ) 目前有四大移动音乐产品:QQ音乐、酷狗音乐、酷我音乐和全民K歌,总月活超8亿。其中,全民K歌与其他三款产品有明显的差异,具体表现如下:以唱为核心,在唱歌……
阅读全文
2022年3月15日
作者 | 贺科学(晨末) 来源 | 阿里巴巴中间件团队 背景 本期文章将接上期 《「技术人生」第3篇:解决问题的规律总结》 继续探讨技术、业务、组织的一般规律及应对策略。需要注意的是,以下内容为个人实践结果的总结和分析,受限于个人能力和经验有限,在描述规律的过程中,可能会存在维度的缺失;或者当前描……
阅读全文
2022年3月15日
“ 本文主要介绍了发表在 WWW2018 的论文《TEM: Tree-enhanced Embedding Model for Explainable Recommendation》,利用 GBDT 叶子节点进行嵌入表示来获得一个具有解释性的推荐模型” 本文来源:RecLismCat https://zhuanlan.zhihu.com/p/96124874 3 TREE-ENHANCED EMBEDDING METHOD 首先提出 TEM,它结合 MF 用于稀疏数据建模和 GBDTs 用于交叉特征学习的优点。还讨论了可解释性,分析了其复杂性……
阅读全文
2022年3月15日
分享嘉宾:张俊林博士 新浪微博 编辑整理:李桂荣 中南财经政法大学 出品平台:DataFunTalk 导读: 深度学习的成功往往依赖于海量数据的支持,根据训练数据标记与否,可以分为有监督学习和无监督学习/自监督学习。监督学习技术已相对成熟,但是对海量的数据进行标记需要花费大量的时间和资源。自……
阅读全文
2022年3月15日
分享嘉宾:周彤 58同城 资深算法工程师 编辑整理:吴雪松 内容来源:58 推荐系统技术沙龙 出品平台:DataFunTalk 导读: 在深度学习的应用过程中,Embedding 这样一种将离散变量转变为连续向量的方式为神经网络在各方面的应用带来了极大的扩展,有"万物皆可 Embeddin……
阅读全文
2022年3月15日
合并重叠区间,也就是那个最大不重叠区间的题目的变种。面试官会让你看题先整理思路,然后分析复杂度,最后面试官觉得你的思路OK就放你在远程连接上手撕代码 链接: https://leetcode-cn.com/problems/merge-intervals/ 1.过拟合和欠拟合。 2.python多进程 3.python深浅拷贝 ~ 文末有福利 ~ 解题思路: 先对输入数组按照区间左边的值进行升……
阅读全文
2022年3月15日
桔妹导读:HBase作为Hadoop生态中表现较为突出的分布式在线数据存储产品,在滴滴有着非常广泛的应用,但同样存在比较突出的短板问题——例如可用性较弱、毛刺严重等,一定程度上限制了它的业务边界。本文主要介绍在此背景下,HBase团队近期进行的一些探索工作。 1. 背景 HBase 是一个基于 HDFS 的……
阅读全文
2022年3月15日
作者:王爷 团队:搜索中台 概述 有赞搜索中台作为有赞企业级搜索能力复用平台,在解决各个业务域搜索问题时是如何探索与实践的,这个过程中有哪些心得,本文与大家一起分享探讨下。 一、问题域 跟绝大多数烟囱式架构面临的问题是相似的,业务自建搜索,独立选型往往会遇到以下问题: 技术选型单一或跟风,比……
阅读全文
2022年3月15日
原文地址: https://cloud.tencent.com/developer/article/1164771 1、推荐系统中的EE问题 Exploration and Exploitation(EE问题,探索与开发)是计算广告和推荐系统里常见的一个问题,为什么会有EE问题?简单来说,是为了平衡推荐系统的准确性和多样性。 EE问题中的Exploitation就是:对用户比较确定的兴趣,当然要利用开采迎合,好比……
阅读全文