2022年3月15日
基础语法 标题 Markdown支持6种级别的标题,对应html标签 h1 ~ h6 1 2 3 4 5 6 # h1 ## h2 ### h3 #### h4 ##### h5 ###### h6 以上标记效果如下: h1 h2 h3 h4 h5 h6 除此之外,Markdown还支持另外一种形式的标题展示形式,其类似于 Setext 标记语言的表现形式,使用下划线进行文本大小的控制 这是一级标题 === 这是二级标题……
阅读全文
2022年3月15日
Bert 给人们带来了大惊喜,不过转眼过去大约半年时间了,这半年来,陆续出现了与Bert相关的不少新工作。 最近几个月,在主业做推荐算法之外的时间,我其实一直比较好奇下面两个问题: 问题一:Bert原始的论文证明了:在GLUE这种综合的NLP数据集合下,Bert预训练对几乎所有类型的NLP任……
阅读全文
2022年3月15日
大部分人在日常的工作当中,都或多或少的会参与项目,而项目要能顺利执行其实并不简单,如果又渉及多个单位合作,困难程度又大增。 对项目经理来说,从他们的工作日志片段可以看出每个人都有自己悲惨的故事,程度恐怕只有过之而无不及。那我们该如何做好项目管理呢? 一、什么是项目管理 在日常工作中开发……
阅读全文
2022年3月15日
来源:新智元,编辑:数据派THU 本文介绍IML领域的历史,给出了最先进的可解释方法的概述,并讨论了遇到的挑战。 近年来,可解释机器学习(IML) 的相关研究蓬勃发展。尽管这个领域才刚刚起步,但是它在回归建模和基于规则的机器学习方面的相关工作却始于20世纪60年代。最近,arXiv上的……
阅读全文
2022年3月15日
配套PPT下载,请识别底部二维码关注社区公众号,后台回复【 1220 】 _ _ 分享嘉宾: 郑晓东** ** 360 技术经理 编辑整理: 王杰 内容来源: DataFun AI Talk**《 AI,让广告投放进入“自动驾驶”》** 出品社区: DataFun 注:欢迎转载,转载请注明出处。 _ _ 一、背景和问题 当我们的客户在谈论广告投放的时候,是在谈论……
阅读全文
2022年3月15日
李兆海 胡智 Qunar技术沙龙 1、项目背景 去哪儿网作为全球领先的旅游搜索引擎,每天有成千上万的用户在这里买到了 低价的机票、酒店等产品,这其中有着庞大的客服团队在背后支持着售后服务工作,用户可以随时随地通过电话或者 chat 找到客服解决行中和行后的问题。随着人工智能在各个领域的应用,客服领域……
阅读全文
2022年3月15日
一,为什么要冗余数据 互联网数据量很大的业务场景,往往数据库需要进行 水平切分 来降低单库数据量。 水平切分会有一个patition key,通过patition key的查询能够直接定位到库,但是非patition key上的查询可能就需要扫描多个库了。 此时常见的架构设计方案,是使用 数据冗余……
阅读全文
2022年3月15日
本文转载自 DataFunTalk 公众号 本文根据贝壳找房王贺青老师在DataFun Talk人工智能技术沙龙中分享的《知识图谱在贝壳找房的从0到1实践》编辑整理而成,在未改变原意的基础上稍做整理。 今天分享的内容有四个方面,第一个介绍下知识图谱,第二个讲为什么 “可以&要”在贝壳找房中落地知识图谱。……
阅读全文
2022年3月15日
分享嘉宾:郭伟东 腾讯 高级研究员 文章整理:李传勇 内容来源:DataFunTalk 出品社区:DataFun 导读: 目前信息流推荐中使用的内容理解技术,主要有两部分构成:1. 门户时代和搜索时代遗留的技术积累:分类、关键词以及知识图谱相关技术;2. 深度学习带来的技术福利:embedding……
阅读全文
2022年3月15日
字节跳动技术团队 背景 在字节跳动的实时计算场景中,我们有很多任务(数量 2k+)会直接服务于线上,其输出时延和稳定性会直接影响线上产品的用户体验,这类任务通常具有如下特点: 流量大,并发高(最大的任务并行度超过 1w) 拓扑类似于多流 Join,将各个数据源做整合输出给下游,不依赖 Checkpoint 没有使用……
阅读全文