2022年3月15日
一次生产系统Full GC问题分析与排查总结 背景 最近某线上业务系统生产环境频频CPU使用率过低,频繁告警,通过重启可以缓解,但是过了一段时间又会继续预警,线上两个服务节点相继出现CPU资源紧张,导致服务器卡死不可用,通过告警信息可以看到以下问题: 从上图可以看到,目前zabbix监控……
阅读全文
2022年3月15日
分享嘉宾:万阳春 度小满 算法专家 编辑整理:仁科 苏州市广播电视总台 出品平台:DataFunTalk 导读: 今天跟大家分享一下,在金融小微场景下,我们通过OCR技术提升业务效率的一些思考和探索。主要介绍以下几大方面: 小微业务痛点 OCR典型应用 OCR背后技术 OCR平台智能化 01 小微业务痛点 首……
阅读全文
2022年3月15日
“本文从跨域联合召会、语义&图谱&多模态、用户多兴趣表征和未来工作四个模块展开。” 引言 内容化这几年越来越成为电商的重点,用户来到网购的时候越来越不局限在只有明确需求的时候,而更多的是没有明确需求的时候,就像是逛街一样。逛逛就是在这样的背景下……
阅读全文
2022年3月15日
作者:vivo互联网服务器团队-Qian Yulun 一、Lucene简介 1.1 Lucene是什么? Lucene是Apache基金会jakarta项目组的一个子项目; Lucene是一个开放源码的全文检索引擎工具包, 提供了完整的查询引擎和索引引擎,部分语种文本分析引擎; Lucene并不是一个完整的……
阅读全文
2022年3月15日
本文根据转转张青楠老师,在DataFun AI+ Talk中所分享的《二手电商知识图谱构建以及在价格模型中的应用》编辑整理而成。 一、知识图谱概述 这次的分享主要从以下四个部分:知识图谱概述、知识图谱构造、转转二手电商知识图谱、在价格模型中的应用。 **1.****1 ** 什么是知识图谱 知识图谱是谷歌在2012年……
阅读全文
2022年3月15日
以下文章来源于搜索与推荐Wiki ,作者Thinkgamer 1.推荐系统经典的级联架构 其实这里本来写的是「传统」的级联架构,后来思索万千,觉得不太合适,就改为了「经典」。因为级联架构目前依旧在各大互联网公司被应用,其扮演的角色也很重要。一般情况下我们常见级联架构主要是由四部分组成,……
阅读全文
2022年3月15日
人工智能一度被炒作为一项可以拯救世界或者毁灭世界的技术。 拨开喧嚣与炒作的迷雾,VentureBeat 与人工智能领域的杰出专家 Google Brain 联合创始人吴恩达,Cloudera 和 Fast Forward Labs 创始人 Hilary Mason,Facebook AI 研究院创始人 Yann LeCun,以及埃森哲人工智能全球负责人 Rumman Chowdhury 进行了一次交流……
阅读全文
2022年3月15日
1 什么是数据倾斜 数据倾斜即指在大数据计算任务中某个处理任务的进程(通常是一个JVM进程)被分配到的任务量过多,导致任务运行时间超长甚至最终失败,进而导致整个大任务超长时间运行或者失败。外部表现的话,在HiveSQL任务里看到map或者reduce的进度一直是99%持续数小时没有变……
阅读全文
2022年3月15日
黄鸿波 什么样的人容易被提升 对于一些已经工作了三年以上的同学来讲,已经到了为自己的未来考虑的时候了。在互联网行业,3 年就是一个坎,对于一个技术能力相对较强的同学,在一家比较大的企业 3 年的时间完全可以从一个新人晋升成为一个组的组长,在一个小公司甚至都有可能变成一个小的技术经理。 在成为……
阅读全文
2022年3月15日
作者: 彭渊 2018 年 11 月 20 日 背景介绍 对于腾讯庞大的大数据分析业务,几千台的 Hadoop 集群,近百 P 级的存储总量,每日产生万亿的消息数据入库,需要针对几十亿 IMEI 手机设备去重,并关联数千亿的历史全表,进行曝光、点击、PV、UV、日活、新增、留存等统计指标分析,当前所有业务的 ETL 清洗、统计计算、用户画像都……
阅读全文