2022年3月15日
背景 在推荐、搜索、广告等领域,CTR(click-through rate)预估是一项非常核心的技术,这里引用阿里妈妈资深算法专家朱小强大佬的一句话:“它(CTR 预估)是镶嵌在互联网技术上的明珠”。 本篇文章主要是对 CTR 预估中的常见模型进行梳理与总结,并分成模块进行概述。每个模型都会从……
阅读全文
2022年3月15日
炼丹笔记干货 作者:九羽 长尾物品(Tail Items)在推荐系统中是非常常见的,长尾的存在导致了样本的不均衡,对于热门头部物品(Head Items)的样本量多,模型学习这部分的效果越好,而长尾物品的样本量少,导致模型对该部分Item的理解不够充分,效果自然也就较差。 那么,针对长尾物……
阅读全文
2022年3月15日
前两天教师节,人工智能头条的某个精神股东粉群里,大家纷纷向当年为我们启蒙、给我们带来快乐的老师们表达感激之情。 很多人表示,他们的硬盘里,至今还保留着当时她们上课时候的视频。有一些现在网站上已经很难找到了,于是大家又纷纷开始互相交流跟随这些老师学习实践的心得体会。 👆禅师最喜欢的教师……
阅读全文
2022年3月15日
作者:徐韬 ,Datawhale 优秀学习者 系列文章: 零基础入门数据挖掘——特征工程实战 零基础入门数据挖掘——数据分析实战 摘要:对于数据挖掘项目,本文将学习如何建模调参?从简单的模型开始,如何去建立一个模型;如何进行交叉验证;如何调节参数优化等。 建模调参: 特征工程也好,数据清洗也罢,……
阅读全文
2022年3月15日
1. 背景 语言模型在自然语言处理具有重要的地位,它是一种基于概率统计的模型,主要的目标是描述字/词在句子中的概率。同时,语言模型是从大量的语料信息中训练出的模型,它“学习”到的词的概率是通用语义的信息,可以和很多实际应用相结合,尤其是在一些基于统计模型的领域,如语音识别,分词,情感分……
阅读全文
2022年3月15日
作者: 黄冠 这个tutorial确实不错 https://www.comp.nus.edu.sg/~xiangnan/sigir18-deep.pdf,我很喜欢,好像一个博士论文一样,将这两个领域梳理得很清楚。 搜索,推荐和广告其实是机器学习在工业界最好的落地。而且容易拿到由用户的行为……
阅读全文
2022年3月15日
文章摘要:MQ分布式消息队列大致流程在于消息的一发一收一存,本篇将为大家主要介绍下RocketMQ存储部分的架构 消息存储是MQ消息队列中最为复杂和最为重要的一部分,所以小编也就放在RocketMQ系列篇幅中最后一部分来进行阐述和介绍。本文先从目前几种比较常用的MQ消息队列存储方式……
阅读全文
2022年3月15日
达观数据 张健 达观数据 前言 推荐系统对于处于信息爆炸时代的我们来说并不陌生。在日常生活中,我们使用到推荐系统提供的各种服务,在社交工具上认识志同道合的朋友,到音乐网站中欣赏自己感兴趣的音乐作品,从一大堆企业岗位信息中挑选出一份称心如意的工作等等。 一个优秀的推荐系统能像朋友一样理解用户……
阅读全文
2022年3月15日
导读: 随着移动互联网和人工智能技术的发展,智能化营销正渗透到各行各业。如何衡量和预测营销干预带来的"增量提升",而不把营销预算浪费在"本来就会转化"的那部分人身上,成为智能营销算法最重要的挑战。 我们以 Uplift Model 为基础,构建营销增益预测模型,帮助商……
阅读全文
2022年3月15日
分享嘉宾:连义江博士@百度 编辑整理:王成林 出品平台:DataFunTalk 导读: 关键词匹配位于整个搜索广告系统的上游,负责将query和keyword按照广告主要求的匹配模式连接起来。该问题面临着语义鸿沟,匹配模式判定和可扩展性方面的挑战。在本文,我们会就同义变换这个主题展开讨论……
阅读全文