2022年3月14日
作者:Jay Alammar 机器之心编译 参与:Panda 前段时间,谷歌发布了基于双向 Transformer 的大规模预训练语言模型 BERT,该预训练模型能高效抽取文本信息并应用于各种 NLP 任务,该研究凭借预训练模型刷新了 11 项 NLP 任务的当前最优性能记录。技术博主 Jay Alammar 近日发文通过图解方式生动地讲解了 BERT 的架构和方法基础。 2018 年是……
阅读全文
2022年3月14日
背景 DSP系统是互联网广告需求方平台,用于承接媒体流量,投放广告。业务特点是并发度高,平均响应低(百毫秒)。 为了能够有效提高DSP系统的性能,美团平台引入了一种带有清退机制的缓存结构LruCache(Least Recently Used Cache),在目前的DSP系统中,使用LruCache + 键值存储……
阅读全文
2022年3月14日
这篇文章是一位 七月在线 推荐高级小班学员的的面试经历的分享,下面的一些问题非常具有代表性,现将面试情况及面试题目分享给大家,祝大家都能有好的offer。 01、基本情况 毕业于985本科,船舶与海洋工程专业,年龄30+(报班之前做的数据分析),0.1的基础来自于船舶行业专业计算软件学到……
阅读全文
2022年3月14日
感谢SIGAI特约作者:mileistone 感受野是卷积神经网络里面最重要的概念之一,为了更好地理解卷积神经网络结构,甚至自己设计卷积神经网络,对于感受野的理解必不可少。 一、定义 感受野被定义为卷积神经网络特征所能看到输入图像的区域,换句话说特征输出受感受野区域内的像素点的影响。 比……
阅读全文
2022年3月14日
美团技术团队 稿 随着美团外卖业务不断发展,外卖广告引擎团队在多个领域进行了工程上的探索和实践,目前已经取得了一些成果。我们计划通过连载的形式分享给大家,本文是《美团外卖广告工程实践》专题连载的第一篇。 本文针对业务提效的目标,介绍了美团外卖广告引擎在平台化过程中的一些思考和实践。我们……
阅读全文
2022年3月14日
作者:任磊 佳昊 金刚等 美团技术团队 2021年5月,美团NLP中心开源了迄今规模最大的基于真实场景的中文属性级情感分析数据集ASAP,该数据集相关论文被自然语言处理顶会NAACL2021录用,同时该数据集加入中文开源数据计划千言,将与其他开源数据集一起推动中文信息处理技术的进步。 本文……
阅读全文
2022年3月14日
作者: 张俊林 原文: https://zhuanlan.zhihu.com/p/100019681 推荐系统技术,总体而言,与NLP和图像领域比,发展速度不算太快。不过最近两年,由于深度学习等一些新技术的引入,总体还是表现出了一些比较明显的技术发展趋势。这篇文章试图从推荐系统几个环节,以及不同的技术角度,来对目前推荐技术的比较彰显的技术趋势做个归纳。个人判断……
阅读全文
2022年3月14日
数据降维问题 在很多应用中,数据的维数会很高。以图像数据为例,我们要识别32x32的手写数字图像,如果将像素按行或者列拼接起来形成向量,这个向量的维数是1024。高维的数据不仅给机器学习算法带来挑战,而且导致计算量大,此外还会面临维数灾难的问题(这一问题可以直观的理解成特征向量维数……
阅读全文
2022年3月14日
本文经授权转载自公众号Spenser的二次学习日记(ID:spenserandhk),作者:Spenser 最近身边朋友换工作的越来越多了,有的已经从体制内辞职,有的在传统高大上公司递交辞呈的路上。他们想出来创业,或是加入创业公司。 我不知道这到底是好事还是坏事,但这就是中国这些年的……
阅读全文
2022年3月14日
作者: 王喆 公众号: 王喆的机器学习笔记 为什么在Google的Wide&Deep模型中,要使用带L1正则化项的FTRL作为wide部分的优化方法,而使用AdaGrad作为deep部分的优化方法? 论文原文的描述是这样的: In the experiments, we used Follow- the-regularized-leader (FTRL) algorithm with L1 regularization as the optimizer for the wide part of the model, and AdaGrad for the deep part. 这……
阅读全文