2022年3月15日
作者:超人赵,人工智能爱好者社区专栏作者 知乎: https://www.zhihu.com/people/chao-ji-sai-ya-ren/posts 用户画像——标签聚类 如何构建用户画像—打用户行为标签 用户画像——数据质量管理 感谢大家长期以来对文章的关注,最近工作比较忙,好久没更新了。接下来的几篇文章想和大家分享下关于用户画像的一些东西。今天我们先从用户画像的标签权重开始聊起吧。……
阅读全文
2022年3月15日
导读 随着公司用户增长业务快速发展,陆续孵化出 部落、同镇、C 端会员、游戏等非常多的业务板块。与此同时产品及运营对实时数据需求逐渐增多,帮助他们更快的做出决策,更好的进行产品迭代,实时数仓的建设变得越发重要起来。本文主要介绍用户增长业务基于 Flink 构建实时数仓的实践之路。 实时数仓1.0介绍……
阅读全文
2022年3月15日
出自 搜狐技术产品 公众号 一简介 在推荐系统的排序环节中,我们经常使用CTR(Click-Through Rate)预估的方式来构建排序模型。在业界的实际应用上,如何通过大规模数据提取出有效特征对用户行为建模、泛化一直是研究人员的工作方向,由于在推荐系统的实际应用中,数据通常非常稀疏,如……
阅读全文
2022年3月15日
今天我们一起回顾一下 近3年来的所有主流深度学习CTR模型,也是我工作之余的知识总结,希望能帮大家梳理推荐系统、计算广告领域在深度学习方面的前沿进展。 随着微软的Deep Crossing,Google的Wide&Deep,以及FNN,PNN等一大批优秀的深度学习CTR预估模型……
阅读全文
2022年3月15日
上篇文章 http://www.6aiq.com/article/1564413040138 详细介绍了Lucene索引表的实现,内容涉及关于Terms Index以及Term Dictionary的剖析。 此文将继续剖析Lucene倒排索引实现的另一部分核心内容: 倒排表(Postings)。Lucene的官方文档关于该部分内容的描述非常丰富,所以学习起来也相对轻松。……
阅读全文
2022年3月15日
简介: 本文由网易云音乐实时计算平台研发工程师岳猛分享,主要从以下四个部分将为大家介绍 Flink + Kafka 在网易云音乐的应用实战: 背景、Flink + Kafka 平台化设计、Kafka 在实时数仓中的应用、问题 & 改进。 简介:本文由网易云音乐实时计算平台研发工程师岳猛分享,主要从以下四个部分将为大家介绍 Flink + Kafka 在……
阅读全文
2022年3月15日
原文地址: https://zhuanlan.zhihu.com/p/72607641 导读: 今天分享一下 facebook 新发的深度学习推荐系统的论文: Deep Learning Recommendation Model for Personalization and Recommendation Systems https://arxiv.org/pdf/1906.00091.pdf 这篇文章概述了当前推荐系统实现的主要思路,提出了一种通用的模型结构 DLRM,与其他常见的 paper 不同,该篇有着浓浓的工业界风格,不仅和其他模型进行效果对比,还讲述了常见的特征如何处理,内在思维逻辑如何,在……
阅读全文
2022年3月15日
原文地址: https://my.oschina.net/u/992559/blog/1819948 作者: moyiguke 前言 在消息处理过程中,除了Flink程序本身的逻辑(operator),我们还需要和外部系统进行交互,例如本地磁盘文件,HDFS,Kafka,Mysql等。虽然Flink本身支持Exactly-Once语义,但是对于完整的数据处理系统来说,最终呈现出来的语义和……
阅读全文
2022年3月15日
淘系的技术发展已经有相当一段历史了,在历史的长河中总能沉淀出很多复杂的巨型项目,包罗多个业务,而且往往服务依赖比较复杂;再加上一些特殊环境变量的设置,想要在本地运行、debug 自测这种大型应用的难度越来越高;尤其是对环境不太熟悉的新人而言成本会更高。 这类应用的单元测试不能像微服务……
阅读全文
2022年3月15日
原文地址: https://blog.csdn.net/lsgqjh/article/details/63685058 ReentrantLock是JUC包中重要的并发工具之一,支持中断和超时、还支持尝试机制获取锁, 并且是一种通过编程控制的可重入锁,尽可能减少死锁问题。本文以公平与非公平锁的加锁释放锁过程成为主线,分析ReentrantLock的重要内容。有问题可以加我微信。 目标 掌握A……
阅读全文