我们该如何学习机器学习中的数学 2022年3月14日 数学在机器学习中非常重要,不论是在算法上理解模型代码,还是在工程上构建系统,数学都必不可少。通常离开学校后很难有机会静下心学习数学知识,因此我们最好能通过阅读小组或读书会等形式营造环境,并专注学习那些在实践中常常需要用到的数学知识。 数学达到什么水平才可以开始机器学习?人们并不清楚…… 阅读全文
面试题精选风控建模流程分箱法的目的及第三方数据评估 2022年3月14日 问题1:分箱后,各箱badrate单调递增从业务上怎么理解呀? 我们有个先验知识,多头越多badrate越大,历史逾期越多badrate越大…等等,如果变量分箱后不符合这个先验,可能就把他剃掉了。 Bad Rate: 坏样本率,指的是将特征进行分箱之后,每个bin下的样本所统计…… 阅读全文
算法解析及实现 2022年3月14日 原文地址: https://www.cnblogs.com/wkang/p/9657032.html 1. GBDT + LR 是什么 本质上GBDT+LR是一种具有stacking思想的二分类器模型,所以可以用来解决二分类问题。这个方法出自于Facebook 2014年的论文 Practical Lessons from Predicting Clicks on Ads at Facebook 。 2. GBDT + LR 用在哪 GBDT+LR 使用最广泛的场景是CTR点击率预估,即预测当给用户推送的广告会不会被用户点击。…… 阅读全文
阿里小蜜多模态知识图谱的构建及应用 2022年3月14日 分享嘉宾:徐国海 阿里巴巴 编辑整理:monk 国家管网 出品平台:DataFunTalk 导读: 本文由阿里巴巴达摩院阿里小蜜团队带来,介绍其在知识图谱方面一年多以来的一些工作进展。主要内容包括:① 知识图谱的简介;② 领域知识图谱的构建及应用;③ 多模态知识图谱的构建及应用;④ Takeaways (心得领悟)。…… 阅读全文
快手技术副总裁郑文为什么说是短视频平台的核心能力 2022年3月14日 本文转载自快手AI技术副总裁郑文CSDI演讲 量子位 授权发布 | 公众号 QbitAI 7月初举办的中国软件研发管理行业峰会(CSDI)上,快手AI技术副总裁郑文针对AI技术在短视频领域的应用做了精彩演讲。他介绍了人工智能技术是如何在快手整个业务流程中发挥作用,以及互联网公司如何从0开始成功推进一个…… 阅读全文
年月字节秋招算法道面试题分享 2022年3月14日 问题1:搜索旋转排序数组带重复值问题 该题为leetcode第81题,搜索先转排序数组II 对于数组中有重复元素的情况,二分查找时可能会有 a[l]=a[mid]=a[r],此时无法判断区间 [l,mid] 和区间 [mid+1,r] 哪个是有序的。 例如nums=[3,1,2,3,3,3,3],target=2,首次二分…… 阅读全文
吴恩达课程从未失望斯坦福深度学习课程全套资料放出附下载 2022年3月14日 吴恩达老师斯坦福CS230深度学习课程资源进行开放了,大家都知道吴恩达老师最出名的是他在coursera的机器学习课程,可以说让很多刚开始接触ml的小白入门该领域。 我个人本身也是在大二下学期由于学校一个创新项目的需求,学习吴恩达老师网易云课堂的机器学习课程,也记得ML从那个时候真…… 阅读全文
深度学习在中的探索与应用 2022年3月14日 文章作者:马宇峰 阅文集团 编辑整理:Hoh Xil 内容来源:作者授权 出品社区:DataFun 本文来自对论文:Applying Deep Learning To Airbnb Search 的解读。 内容大纲: 效果概览 模型演进 失败尝试 特征工程 系统介绍 一、效果概览 分为离线和在线俩部分。其中,一个重要指标是 NDCG 标准化文档累计增益,NDCG = DCG/IDCG 。 二、模…… 阅读全文
自然语言处理基础上下文词表征入门解读 2022年3月14日 原文自: 大快搜索 公众号 自然语言处理的基础涉及到对词的表征。华盛顿大学计算机科学与工程教授 Noah Smith(史諾亞)近日在 arXiv 发布了一篇入门介绍论文,由浅入深通俗易懂地介绍了自然语言处理中对词的处理和表示方法。 摘要:这篇介绍论文的目的是讲述如何让计算机处理语言的故事。这是自然语言处理(N…… 阅读全文
张菡深度学习下的京东搜索召回技术 2022年3月14日 分享嘉宾:张菡 京东 算法工程师 编辑整理:吴祺尧 出品平台:DataFunTalk 导读: 搜索主要经历四个阶段:召回、粗排、精排和重排,最后呈现给用户最终的结果。而召回的结果主要来自两个部分:倒排检索和语义召回。传统的倒排检索依赖字面匹配,很难去召回一些语义相似但是字面不匹配的商品。传统…… 阅读全文