2022年3月15日
分享嘉宾:赵学敏博士 京东科技 编辑整理:蔡丽萍 TRS 出品平台:DataFunTalk 导读: 在电商企业采购和运营过程中,如果要想掌握商品的实时价格等行情信息,就需要对齐各个电商网站的商品。由于各个电商网站的运营体系不同,网站的类目体系、商品属性等等往往存在很大差异,需要将这些实体信息进行……
阅读全文
2022年3月15日
导读:微软小冰是领先的跨平台人工智能系统, 本次分享将介绍微软小冰最新的对话技术框架,以及在这套框架的基础之上,如何一步步构建 人格化 的 对话系统,并且在社交娱乐及实用场景当中的具体运用。主要包括: 如何构建基本的对话系统? 人格化的定义及如何部分实现人格化 如何构建基本的对话系统? 广义对话……
阅读全文
2022年3月15日
https://zhuanlan.zhihu.com/p/29765582 现在网上介绍gbdt算法的文章并不算少,但总体看下来,千篇一律的多,能直达精髓的少,有条理性的就更稀少了。我希望通过此篇文章,能抽丝剥茧般的向初学者介绍清楚这个算法的原理所在。如果仍不清楚可以在文后留言。 1、如何在不改变原有模型的结构上提升模型的拟合能力 假设现在你有样本集 ,然后……
阅读全文
2022年3月15日
1 前言 OPPO的大数据离线计算发展,经历了哪些阶段?在生产中遇到哪些经典的大数据问题?我们是怎么解决的,从中有哪些架构上的升级演进?未来的OPPO离线平台有哪些方向规划?今天会给大家一一揭秘。 2 OPPO大数据离线计算发展历史 2.1 大数据行业发展阶段 一家公司的技术发展,离不开整个行业的……
阅读全文
2022年3月15日
高茂雨 58技术 导读: 58智能问答机器人是由58AI Lab自研的一套人工智能问答系统,结合自然语言处理、深度学习、语义理解、智能推荐等多种人工智能技术,通过自主学习,精确识别用户意图,实现与用户进行智能问答。实现了QABot业务咨询问答、TaskBot任务多轮对话、问答推荐等多种能……
阅读全文
2022年3月15日
这里是 王喆的机器学习笔记 的第四篇文章,之前我们一起讨论了阿里的DIN,YouTube的深度学习推荐系统,本来今天想再分享另一篇科技巨头的业界前沿文章, Airbnb的Embedding方法 但因为文章中涉及word2vec的技术细节,为了保证一些初学者的知识是自洽的,我还是想在此之前……
阅读全文
2022年3月15日
分享嘉宾:周建斌 58同城 算法高级架构师 编辑整理:吴雪松 小米 出品平台:DataFunTalk 导读: 58部落是面向58同城同镇用户的内容社区,主要产品形态为PGC、UGC的信息流,样式丰富。基于业务和背景,如何提升定义信息流价值内容占比,提升点击率、留存率、互动率等多个目标?今天就和……
阅读全文
2022年3月15日
16KDD node2vec node2vec 是斯坦福男神教授 Jure Leskovec 的代表作之一,网上有非常多关于这篇论文的讨论和解析,所以这里我不再累述。 node2vec 中提出的网络的 “ 同质性” 和 “ 结构性” 是两个比较抽象的概念,之前看论文的时候没有仔细斟酌,但看了王喆大佬的文章之后,惊觉一直以来对 node2vec 理解有误。为了搞清楚这两个概念,我写了一份简单的 node2vec……
阅读全文
2022年3月15日
丁香园大数据 NLP 文章发表于: 2019-12-31 医疗健康领域的短文本解析探索(一) 谈谈医疗健康领域的 Phrase Mining 前言 再来简单回顾一下之前内容,上一篇《 医疗健康领域的短文本解析探索(一)》我们简单的介绍了目前工业界常用的 concept/phrase 的自动化抽取和评估的方法,之后我们又介绍了两种结构化电子病历的方法,第一种构建 MeSH 语义树,……
阅读全文
2022年3月15日
原文作者: 章立 本站授权首发 checkpoint 主要的目的有两个: 如果训练过程中出现的意外情况,可以通过checkpoint快速恢复 通过checkpoint可以 stop early,这样使得算法效果更好 keras 在keras中使用 Model.save_weights 方法来生成checkpoint. 但是如果使用这个方法的话,Model的layer必须……
阅读全文