金融风控大厂道精选面试题分享 2022年3月14日 问题1:深度学习的风控模型,从经验上看,样本量大概要多少条啊 解析:不同的模型不一样,而且也不光要注意样本量,比如RNN其实希望序列长度至少在12个月以上,粗略的说,样本量五十万以上效果比较好。 问题2:5万正样本,200负样本,B卡,不只是提高额度,会拒绝一部分客户,怎么建模? 5万…… 阅读全文
机器学习模型如何优化干货总结 2022年3月14日 NLP杂货铺 微信号:gh_90d682be2296 历时几个月的NLP中文预训练模型泛化能力挑战赛【25】已经圆满结束,进入决赛的各个队伍都提供了很好的方案模型。 这次比赛是CLUE与阿里云平台、乐言科技联合发起的第一场针对中文预训练模型泛化能力的挑战赛。 赛题以自然语言处理为背景,要…… 阅读全文
新一代京东电商广告排序模型 2022年3月14日 分享嘉宾:刘鹄 京东 算法工程师 编辑整理:李沛欣 出品平台:DataFunTalk 导读: 随着电商平台对图像信息的大量引入,通过图像分析来进行广告点击率判断就成了新的趋势。本次分享的主题为CSCNN:新一代京东电商广告排序模型,主要介绍视觉信息在CTR排序模型中的应用。一方面,我们将介绍…… 阅读全文
机器学习建模中的思想 2022年3月14日 Datawhale干货 作者:小偶,来源:偶数科技 我们在生活中做出的许多决定都是基于其他人的意见,而通常情况下由一群人做出的决策比由该群体中的任何一个成员做出的决策会产生更好的结果,这被称为群体的智慧。集成学习(Ensemble Learning)类似于这种思想,集成学习结合了来自多…… 阅读全文
用户画像番外篇之随笔三则 2022年3月14日 超人赵,人工智能爱好者社区专栏作者 知乎: https://www.zhihu.com/people/chao-ji-sai-ya-ren/posts 一则:开发上的一点记录 文章说是生活随笔,到不如说是对本周开发工作中的一些体会与思考的记录。 这个专栏我想除了对知识上的一些记录,以后也可以加入生活上的收获。好记性不如烂笔头,或许多年后再回看这些文章,回看进步的历程,也是一件很有成就感的事情…… 阅读全文
一些的面试问题 2022年3月14日 作者:Pratik Bhavsar 编译:ronghuaiyang 导读: 在NLP的面试中提问频率非常高的问题。 练习 NLP 是一回事,破解面试是另一回事。对 NLP 人员的面试与一般的数据科学非常不同。在短短几年内,由于迁移学习和新的语言模型,这些问题已经完全改变了。我个人经历过,随着时间的推移,NLP 面试变得…… 阅读全文
网易向量体系在严选的落地实践 2022年3月14日 严选技术团队 向量化在业界的运用越来越广,近期也有许多文章分享过相关的主题。严选于 18 年下半年开始探索向量化在搜索推荐场景中的运用,从最开始基于商品召回用户的任务到后续的搜索召回、搜索个性化排序、搜索底纹、搜索发现词、搜索建议词、跨类目推荐、推荐召回、多兴趣召回、通用排序、端智能重排…… 阅读全文
深入理解推荐系统召回 2022年3月14日 阅读原文 深入理解推荐系统:召回 深入理解 YouTube 推荐系统算法 深入理解推荐系统:排序 写在前面 作为【推荐系统】系列文章的第二篇,将以“召回”作为今天的主角,会从四个方面来介绍召回的不同算法方式,即基于内容的召回、协同过滤、基于 FM 模型召回和基于深度学习的方法。 一、背景介绍 召回是推荐系统的第一阶…… 阅读全文
通俗解释协方差与相关系数 2022年3月14日 来自: AI有道 (微信号:redstonewill),作者:红色石头 什么是协方差(Covariance)? 协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量…… 阅读全文
达摩院李雅亮大规模预训练模型的压缩和蒸馏 2022年3月14日 分享嘉宾:李雅亮博士 阿里巴巴 编辑整理:陈东 东南大学 出品平台:DataFunTalk 导读: 本次分享的主题为大规模预训练模型的压缩和蒸馏,主要是从自动机器学习的角度,介绍大规模预训练模型的压缩和蒸馏。将介绍阿里巴巴达摩院关于模型压缩的三个连续承接性的工作: 工作1:AdaBERT:Ta…… 阅读全文