2022年3月14日
本文转发于 DataFunTalk 公众号 本文根据贝壳找房邓钫元老师在中国HBase技术社区第二届MeetUp:“HBase技术解析及应用实践”中分享的《HBase在贝壳找房的实践经验》编辑整理而成,在未改变原意的基础上稍做整理。 钫元老师 首先给大家介绍一下贝壳,贝壳是链家一个房地产品牌,链家的愿景是把贝……
阅读全文
2022年3月14日
房租正重蹈房价泡沫的覆辙 昨天还幻想海边别墅的年轻人,今天可能开始对房租绝望了。 过去一个月,全国热点城市的房租如脱缰野马。一线的房租同比涨了近20%。一夜醒来,无产青年连一块立锥之地都悬了。 即便逃离了北上广深,成都、西安也有30.98%、25.08%的同比涨幅在等着人才们落户。 从2……
阅读全文
2022年3月14日
我先结合一些案例解释在商业市场等战场上“降维打击”的含义和应用原理,然后进一步讨论“降维”之说对于日常问题分析的价值,挖掘“降维”式的思维模型。读过《三体》有助于形象化理解,但完全不要求有《三体》知识背景。 一、商业市场的降维打击 说起降维打击,360安全软件是个经典案例。免费的姿态……
阅读全文
2022年3月14日
作者 | mokong 搜狐技术产品 导读 随着AlphaGO在围棋界接连战胜世界冠军,其背后的技术-强化学习逐渐获得学术界、工业界的青睐。在新闻推荐任务中,传统的推荐算法无法考虑单个请求内新闻之间的关联,也无法考虑多个请求之间的关系,而强化学习,通过学习推荐策略给解决上述问题带来了可能。 1.强化学……
阅读全文
2022年3月14日
大家好,我是kaiyuan。关于前沿技术在工业界的实践落地应用,我们之前分享过一些文章: 大规模搜索+预训练,百度是如何落地的? KDD'21 | 淘宝搜索中语义向量检索技术 全方位解读 | Facebook的搜索是怎么做的? 深度学习在Airbnb搜索的应用实践 小红书在推荐多样化的实践——SSD KDD'21 | 揭秘……
阅读全文
2022年3月14日
铭毅天下Elasticsearch 出品 1、实战项目需求 需求1:有一个小需求 kafka源数据: topicA:{"A_content":"XXX","name":"A","type":"XXX","id":1} topicB:{"B_content":"XXX","name":"B","type":"XXX","id":1} 现在想将两个topic的数据写到同一个es索引中,但由于更新性能太慢,有啥思路可以加速写入性能呢(topicA和topicB的数据可能会有几天的延时)? 需求2: 在cluster1上有如……
阅读全文
2022年3月14日
分享嘉宾:Jason Xu@阿里巴巴 编辑整理:夏仙森 出品平台:DataFunTalk 导读: 本文主要介绍手淘流量分析业务发展过程中,实时性业务分析需求的产生,实时分析目标的设定,如何进行技术的选型,以及如何基于ClickHouse构建系统架构和未来的业务预期。主要内容包括: 流量分析与……
阅读全文
2022年3月14日
作者 | 韩飞 1. 引言 随着大数据技术的不断发展,数据实时性的需求变得越来越迫切,这对实时数据处理的基础架构提出了更高的要求。如何应对实时数据的流量变化,特别是突发流量,成为实时数据处理架构不得不面对的挑战性问题。对于 FreeWheel 这样一家服务全美 90% 的主流电视媒体和运营商的视频广告投放和管理平台,对……
阅读全文
2022年3月14日
叶子 字节跳动技术质量 稿 简介 对于软件研发来说,持续、快速、高质量、低风险的交付需求特性,是业务对研发的主要诉求。目前各企业团队也正处于DevOps转型的不同阶段,字节跳动产品研发部质量架构团队针对业务现状,建立无人测试流水线专项,帮助业务建设从需求至交付全阶段流水线,提升产品发布质……
阅读全文
2022年3月14日
文章作者:胡明昊 58金融 内容来源:58技术 导语: 本文讲述了金融数据仓库从无到有的整体设计思路,以及对数据建模、质量控制、元数据管理及开发规范各方面的经验思考,希望对大家在数仓建设工作方面有所帮助。 背景 自2018年以来,随着业务体系的不断丰富与发展,数据分析与应用需求越来越丰富,对……
阅读全文