2022年3月15日
文末彩蛋:七月在线干货组最新升级的《2021大厂最新AI面试题 [含答案和解析, 更新到前121题]》免费送! 项目一:GiantMIDI-Piano — 钢琴MIDI数据集 钢琴转谱是一项将钢琴录音转为音乐符号(如 MIDI 格式)的任务。在人工智能领域,钢琴转谱被类比于音乐领域的语音识别任务。然而……
阅读全文
2022年3月15日
这篇博客意图是收集市面上质量不错的搜索引擎技术资料,内容来源包括开源项目官网(Lucene、Solr、Elastic)、综合技术网站(infoQ、Stackoverflow、github 等)、专业技术网站(我爱自然语言处理等)、国内外知名互联网公司技术博客(阿里中间件团队博客、美……
阅读全文
2022年3月15日
文末彩蛋:七月在线干货组最新升级的《2021大厂最新AI面试题 [含答案和解析, 更新到前121题]》免费送! 1、分词方法BPE和WordPiece的区别 BPE与Wordpiece都是首先初始化一个小词表,再根据一定准则将不同的子词合并。词表由小变大 BPE与Wordpiece的最大区……
阅读全文
2022年3月15日
作者:伴鱼技术团队 陈易生 前言 本文是 「算法工程化实践调研」 系列的第 2 篇,介绍来自 Uber 在 2017 年 9 月发布的技术博客 Meet Michelangelo: Uber’s Machine Learning Platform [1]。它介绍了机器学习平台 Michelangelo(意大利文艺复兴时期伟大的绘画家、雕塑家、建筑师和诗人)的各个组件的职能,第一次细致地向大家描述了机器……
阅读全文
2022年3月15日
文章作者:姚凯飞 编辑整理:Hoh 内容来源:作者授权 出品平台:DataFunTalk 导读: 你是否有过来自用户、业务和老板们的 badcase “灵魂拷问”: 我运营的首页频道入口不可用,怎么回事呢? 为什么推送的消息,点进去是空白页面? 为何这个商品的排序是这样的? 这个前端改版为……
阅读全文
2022年3月15日
复杂业务系统长期迭代,难免会逐渐腐化,如何治理腐化,并设计出能够延缓腐化,保持长期高效能的方案是一个开发同学难免要遇到的问题,本文旨在介绍一套基于DDD的落地实施方案,提供另外一种解决问题的思路。 系统背景 Teddy出入库系统,是进销存概念里的进和销,核心能力是仓库货物的出库和入库……
阅读全文
2022年3月15日
在前面的文章中,我们介绍了在 Lucene7.5.0 中 索引文件.dim&&.dii 的数据结构,从本篇文章开始介绍其生成索引文件。dim&&.dii 的内容,注意的是,由于是基于 Lucene8.4.0 来描述其生成过程,故如果出现跟 Lucene7.5.0 中不一致的地方会另外指出,最后建议先阅读下文章 Bkd-Tree 简单的了解下 Lucene……
阅读全文
2022年3月15日
写在前面 今年最大的成长之一就是对沟通的理解和认知,包括沟通的意义,如何更好的去沟通,毕竟因为沟通踩了不少坑。但就在最近从樊登的一个演讲中,听到了“沟通视窗”的模型,感觉特别惊艳,它将沟通这个抽象高维的事情映射到更多人可以理解的二维上去讨论,不同场景不同个体的沟通都可以套用的框架。……
阅读全文
2022年3月15日
作者:CreateMoMo 编译:ronghuaiyang 前几篇文章: BiLSTM 上的 CRF,用命名实体识别任务来解释 CRF(1) BiLSTM 上的 CRF,用命名实体识别任务来解释 CRF(2)损失函数 BiLSTM 上的 CRF,用命名实体识别任务来解释 CRF(3)推理 导读:今天给大家介绍一下具体的代码实现。 3 Chainer 实现 在……
阅读全文
2022年3月15日
文末彩蛋:七月在线干货组最新升级的《2021大厂最新AI面试题 [含答案和解析, 更新到前121题]》免费送! 项目一:semantic-segmentation-tutorial-pytorch使用Cityscapes进行语义分割的PyTorch代码库 项目地址: https://github.com/hoya012/semantic-segmentation-tutorial-pytorch 使用PyTorch的……
阅读全文