2022年3月15日
分享嘉宾:Elvin 腾讯音乐 高级工程师 编辑整理:李一 中科雨辰 出品平台:DataFunTalk 导读: 近几年来,图数据在计算机领域得到了广泛的应用。互联网数据量指数级增长,大数据技术、图数据方面的应用增长很快,各家互联网大厂都在图数据分析和应用方面大量投入。为了让我们的搜索更加智能化……
阅读全文
2022年3月15日
原文地址: 谓之小一 公众号 拍摄于无锡古镇 1.LDA简介 线性判别分析(Linear Discriminant Analysis, LDA) 是一种监督学习的降维方法,也就是说数据集的每个样本是有类别输出。和之前介绍的 机器学习降维之主成分分析(PCA) 方法不同,PCA是不考虑样本类别输出的无监督学习方法。LDA的原理简单来说就是将带上标……
阅读全文
2022年3月15日
本文承接 索引文件的生成(五) 继续介绍剩余的内容,下面先给出生成索引文件。tim、.tip 的流程图。 生成索引文件。tim、.tip 的流程图 图 1: 上一篇文章中,我们介绍了执行 生成一个或多个NodeBlock 的触发条件,本文就其实现过程展开介绍,同样的,下文中出现的并且没有作出解释的名……
阅读全文
2022年3月15日
分享嘉宾:苏舒 腾讯 高级工程师 编辑整理:路培杰 内容来源:Flink中文社区 导读: Apache Flink 是目前大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构,以 Iceberg、Hudi、Delta 为代表的解决方案应运而生,Iceberg 目前支持 Flink 通过 DataStream API /Table API 将数据写入……
阅读全文
2022年3月15日
作者:老雷 部门:有赞 / 效能改进 导语 在不同形式的组织当中,随着分工高度专业化和精细化,成员之间的交流合作方式日益复杂。协同单元之间常见的问题就是 看似达成一致,出现问题后才感知背道而驰,各方对目标、路径的理解都存在差异。事情想往前推进,往往需要更高层的负责人介入,沟通过程事倍功半,而……
阅读全文
2022年3月15日
作者:微信WeOLAP团队&腾讯云数据仓库 Clickhouse 团队 微信作为一款国民级应用,已经覆盖了社交、支付、出行等人们生活的方方面面。海量多样化的业务形态,对数据分析提出了新的挑战。为了满足业务数据分析的需求,微信 WeOLAP 团队联手腾讯云,共建千台规模、数据 PB 级、批流一体的 ClickHouse 数据仓库,实现了 10……
阅读全文
2022年3月15日
本文概览: 本文又名《Distributed Representation: From Static Embedding to Contextualized Embedding》 1. Classical Representation: One-hot Encoding 独热编码是NLP领域最简单的一种单词表示法。One-hot Encoding就是一个单词用长度为的向量表示,其中只有一个位置为,其余位置为,为语料中词库的大小。 One-hot Encoding有什么问题呢?假如我……
阅读全文
2022年3月15日
分享嘉宾:郭跃超 腾讯 应用研究员 编辑整理:康德芬 出品平台:DataFunTalk 导读: Angel是腾讯自研的分布式高性能的机器学习平台,支持机器学习、深度学习、图计算以及联邦学习等场景。Angel的深度学习平台已应用在腾讯的很多个场景中。所以今天会为大家介绍Angel:深度学习在腾……
阅读全文
2022年3月15日
口述 | 徐羽 整理 | 王强 在 AICon 全球人工智能与机器学习技术大会(2021)北京站 上,腾讯信息平台与服务线 CTO、PCG 事业群推荐与 AI 中台负责人徐羽带来了主题为《Al 与推荐技术在腾讯 QQ 浏览器的应用》的分享,详细介绍了 QQ 浏览器近年来在 AI 推荐技术方面走过的技术旅程。本文由 InfoQ 根据徐羽的演讲内容进……
阅读全文
2022年3月15日
来源: https://zhuanlan.zhihu.com/p/446993392 1. 前言 搜索广告直通车作为阿里妈妈营收大盘的中流砥柱,十年来通过产品和技术层面的不断自我革新升级,每年都能够保持业务高速增长。搜索广告预估模型方向(全链路多阶段CTR&CVR&CXR等预估模型)作为提效主力军,今年在技术上持续深耕和创新,在如此大规模业务体量……
阅读全文