2022年3月15日
当设置了TermVector的域生成了 倒排表 以后,将文档的词向量信息写到.tvx(vector_index)跟.tvd(vector_data)文件中。 数据结构 .tvd 图1: PackedIntsVersion PackedIntsVersion描述了压缩使用的方式,当前版本中是VERSION_MONOTONIC_WIT……
阅读全文
2022年3月15日
. 分享嘉宾:李渔 熵简科技 联合创始人 编辑整理:唐汝佳 出品平台:DataFunTalk 导读: 本次分享的主题是金融资管领域知识图谱的构建和应用,主要介绍如何运用大数据、AI这些技术手段,来帮助金融资管客户构建一套面向金融资管领域的知识图谱系统。主要内容包括: 金融资管行业为什么需要知识图……
阅读全文
2022年3月15日
论工程师的商业头脑 我们常常听到这样的话,“某某同学有很好的business sense”,这通常是评价一个非业务类型的同学,如果这个同学是一个软件工程师,那么他一定很受产品和业务的青睐,因为对他们来讲,这样的技术同学交流起来更顺畅,换句话说,就是更有共同语言。 什么是“busines……
阅读全文
2022年3月15日
Awesome-algorithm-interview 算法工程师(人工智能 cv 方向)面试问题及相关资料的网站收集 Algorithm Engineer 1. GitHub 算法/深度学习/NLP 面试笔记 Github 算法工程师面试 Github 2019 届秋招面经集合 Github 技术面试必备基础知识 Github AI 算法岗求职攻略 Github (amusi) 阿里、腾讯、百度、华为、京东、搜狗和滴滴最新面试题汇集 Github 「面试算法练级攻略」-「LeetCode 题解」-「……
阅读全文
2022年3月15日
在网上看见有一个笑话是这样的: 程序员写出自认为没有 Bug 的代码。 软件测试,发现了 20 个 Bug。 程序员修改了 10 个 Bug,并告诉测试组另外 10 个不是 Bug。 测试组发现其中 5 个改动根本无法工作,同时又发现了 15 个新 Bug。 重复 3 次步骤 3 和步骤 4。 鉴于市场方面的压力,为了配合当初制定的过分乐观的发……
阅读全文
2022年3月15日
袁一@工商银行 摘要: 本文整理自中国工商银行大数据平台负责人袁一在 Flink Forward Asia 2021 的分享 一、工行实时大数据平台建设历程 工商银行从 2002 年开始建设数据集市,当时主要使用 Oracle 类单机版的关系型数据库。随着数据量不断增加,开始引入 TD、ED 等国外高端一体机。2014 年工行正式基于 Hadoop 技术建设了大数据平台,……
阅读全文
2022年3月15日
我的个人 微信公众号: Microstrong 微信公众号 ID:MicrostrongAI 目录: GBDT 分类算法简介 GBDT 二分类算法 2.1 逻辑回归的对数损失函数 2.2 GBDT 二分类原理 GBDT 二分类算法实例 手撕 GBDT 二分类算法 4.1 用 Python3 实现 GBDT 二分类算法 4.2 用 sklearn 实现 GBDT 二分类算法 GBDT 分类任务常见的损失函数 总结 Reference 本文的主要内容概览: 1. GBDT 分类算法简介 GBDT 无……
阅读全文
2022年3月15日
作者介绍 井显生,2019年加入去哪儿,现负责国内机票出票、退款、改签核心业务。在领域驱动设计(DDD)、高并发有大量实践经验。 一、前言 去哪儿网国内机票售后是为用户提供退票、改签、航班变动、行程服务、疫情政策等服务的业务。业务场景中有复杂的基于订单、客票、 PNR 、行程、航司等各种维度的……
阅读全文
2022年3月15日
作者:Amit Chaudhary 编译:ronghuaiyang 导读: 如果人工智能是一块蛋糕,那么蛋糕的大部分是自监督学习,蛋糕上的糖衣是监督学习,蛋糕上的樱桃是强化学习。 Yann Lecun 在他的演讲中引入了“蛋糕类比”来说明自监督学习的重要性。虽然这个类比是有争论的,但我们也已经看到了自监督学习的影响,在自然……
阅读全文
2022年3月15日
李夏昕 ElasticSearch 是基于 Lucene 实现的分布式搜索引擎,提供了海量数据实时检索和分析能力。滴滴从 2016 年 4 月开始组建团队,解决 ElasticSearch 在使用过程中遇到的性能问题。并且,随着业务体量的发展,滴滴构建了基于 ElasticSearch 的一站式搜索平台。InfoQ 邀请到了滴滴出行高级专家工程师、 QCon 全球软件开发大会(广州站) 讲师张亮,请他聊……
阅读全文