菜鸟实时数仓技术架构演进

分享嘉宾:贾元乔 菜鸟 高级数据技术专家 编辑整理:夏飞飞 内容来源:Flink Forward ASIA 出品平台:DataFunTalk 导读: 在开源盛世的今天,实时数仓的建设已经有了较为成熟的方案,技术选型上也都各有优劣。菜鸟作为物流供应链的主力军,时效要求已经成为了核心竞争力,离线数仓已不能满足发展的需要……

阅读全文

两万字深度介绍分布式系统原理一文入魂

作者:慕容千语 链接: https://www.jianshu.com/p/06136a5d49e8 1 概念 1.1 模型 节点 在具体的工程项目中,一个节点往往是一个操作系统上的进程。在本文的模型中,认为节点是一个完整的、不可分的整体,如果某个程序进程实际上由若干相对独立部分构成,则在模型中可以将一个进程划分为多个节点。 异常 机器宕机:机器宕机是最常见的异常之一。在大型……

阅读全文

从零开始掌握算子开发架构以及编译构建

系列文章: 从零开始掌握 tensorflow 算子开发系列文章 作为算子开发教程的第一篇,我们首先简单介绍 Tensorflow 的架构以及的算子 (Operator) 在 Tensorflow 的计算图扮演的角色。在简单了解算子之后,我们将实践介绍如何从 Tensorflow 源码编译构建属于自己的 Tensorflow Python 包。 Tensorflow 架构介绍 Tensorflow 是一个多语言的项目,Tensorflow 的底层功能主要由 C 与 C++ 实现,并……

阅读全文

图文并茂带你了解依存句法分析

作者: 龚俊民(昵称: 除夕) 学校: 新南威尔士大学 单位:Vivo AI LAB 算法实习生 方向: 自然语言处理和可解释学习 知乎: https://www.zhihu.com/people/gong-jun-min-74 前言: 上一期我们讲了成分句法分析,它相当于考虑广义上的嵌套关系的命名实体识别。这一次我们来说一说依存句法分析,它相当于文本结构化任务中,与命名实体识别经常在一起的实体关……

阅读全文

布道师系列周晓凌乘风而来利用数据科学平台解决运筹学问题

DataCanvas布道师团队成员 首席解决方案架构师 周晓凌 此番呈上 利用数据科学平台解决运筹学问题 不仅仅是机器学习 近年来机器学习与深度学习快速发展,极大地吸引了人们的眼球,甚至有将人工智能(AI)等价于深度学习的趋势。然而人工智能的范畴相较于机器学习与深度学习要大得多,吴恩达在其深……

阅读全文

机器学习数学基础常见分布与假设检验

作者:吴忠强,Datawhale优秀学习者,东北大学 所谓机器学习和深度学习, 背后的逻辑都是数学, 所以数学基础在这个领域非常关键, 而统计学又是重中之重, 机器学习从某种意义上来说就是一种统计学习。 这次是学习概率统计的第三篇文章, 基于前两篇文章进行展开。在第一篇文章的 概率论基础 学习了离……

阅读全文

腾讯互联网知识图谱的构建及应用

分享嘉宾:单子非 腾讯 高级应用研究员 编辑整理:盛泳潘 重庆大学 助理研究员 出品平台:DataFunTalk 导读: 大家好,我是单子非,来自腾讯的微信事业群。我今天分享的主题是"知识图谱的构建与互联网场景下的应用"。主要想从学术界与工业界两个角度给大家带来一些分享:将介……

阅读全文

苏宁搜索引擎在苏宁易购商品评价系统中的应用

胡正林 2018 年 11 月 5 日 话题:架构大数据 背景说明 苏宁易购商品评价系统主要提供商品维度评价数量聚合、评价列表展示功能,并为其他业务系统提供商品评价数据支撑服务。功能涉及对亿级数据的数量聚合、排序、多维度查询等复杂的业务场景,关系型数据库的索引为 B-Tree 结构,适合数值区分度或离散度高的数据,而评……

阅读全文

闲鱼是如何做个性化商品选品及人群画像分析的

作者: 深宇 闲鱼技术 背景 运营或者产品同学开展的各种导购、外投活动中常常需要做商品选品或者用户圈选,来提高活动的相关指标。一般的步骤包括商品选品、ab实验、用户画像分析、活动全量投放。其中如何快速准确并且多样地做商品选品以及相关人群画像分析决定着活动效果的好坏。 常用的商品选品方案包括……

阅读全文

马蜂窝多层分流系统的设计与实现

导读: 5 月 23 日,马蜂窝旅游网宣布完成 2.5 亿美元新一轮融资,此轮融资由腾讯领投。 在接授腾讯《潜望》栏目的专访时,马蜂窝 CEO 陈罡谈到,「现在马蜂窝是个数据驱动的公司,要以结果说话,能用 ABTest 解决的问题就没有必要谈其他」。 作为一家数据驱动的公司,当前在马蜂窝 ABTest 已经基本覆盖所有业务线并稳定运行。……

阅读全文

最近文章

福利派送

分类

标签

360搜索 58同城 Abtest AB测试 AdaBoost AdaDeltaW AdamW AdvancedFeaturesOfNetty AFM模型 AI AIGC AILab Airbnb AI平台 AKF架构 Alink Android ANN AnnotationFormatterFactory Announcement AOF AOP Apache ApacheFlink Apollo AQS ArchitectureDesign AresDB ASR AUC Augur Automaton AutoML Bagging Bandits Basic BERT BI BigGAN BI平台 Boosting BPR Checkpoint Clazz ClickHouse Cluster CNN Collection ConcurrentCoding ConcurrentProgramming Condition CRF Css Cto CTR CTR模型 CTR预估 CV CVPR DDD DDD实战 DeepFFM DeepFM DeepFM模型 DesignPattern Devops Dgraph DIN DKN模型 DMP平台 Docs Doris DPP DRN Druid DSP DSSM Dubbo EE问题 Elasticsearch ELK ELMo Embedding EncodingSpecification Epoll ESSM ETL Faraday Feed流 FFM FFM模型 FixedBitSet FixMatch Flink Flutter FM FM模型 Format FreeWheel FST FTRL FullGC Game GAN GBDT GBDT+LR融合 GBM GC Git Github Gitlab GNN Go Golang Google Graphql GraphScope GRU4REC Ha3 Hadoop Hbase Hologres Hystrix Iceberg IM ImageNet Impala InnoDB IntBlockPool IoC IOTechnologyBase IRGAN IT博士 IT移民 JanusGraph Java JavaScript Jdbc JDK JS Kafka KBQA Kubernetes KV存储 Lab LambdaMART LDA LearningExperience LinUCB方法 Linux LruCache LSTM LSTM网络 Lucence Lucene Message Milvus MKR模型 MLflow MMoE Mock MoE Monorepo MRR Mvc Mybatis MySQL Nacos NDCG NER Netty Netty主要组件源码分析 Netty多协议开发 Netty技术细节源码分析 Netty编解码 Nexp Nextjs Nifi NIO NIPS NLP Node2vec Nodejs Npm OCR OKR Olap One-Hot OPPO Oss PageRank Parser PersonalExperience Pinot PlaceholderResolver Printer PropertySource Pulsar Push系统 Python Pytorch Q&A Que2Search Query扩展 Query理解 Query纠错 R-Tree React Reactjs Reactor Redis Region Registry Remote RippleNet RMI ROC RocketMQ Rpc RTree Scala SD Select Sentinel Serverless SHAP Sharding SIGAI SimCLR Skleam Softmax Solr Spark SPI Spring Spring5新特性 SpringBoot SpringBootBatch SpringCloud SpringMVC SpringSecurity SpringTransaction Spring整体脉络 Spring源码故事(瞎编版) Sqllit Stable Diffusion Stage Storm Storybook SVM Tailwind TCP粘拆包 TensorFlow TFServing Tomcat Topk Trace Transformer TurboSearch TX Typora UX Vivo Vuejs Web Web3 WebRTC Wide&Deep Word2vec XDeepFM XDL XGBoost XLNet Yoo视频 YoshuaBengio ZeroSearch Zookeeper 一致性 丑小鸭定理 业务 业务线 个性化推荐 个性化海报 中关村 中文分词 中文纠错 主题建模 书籍 事件驱动架构 事务 亚马逊 交叉验证 人工智能 人机问答 供应链 依存句法分析 信息检索 信息流推荐 倒排索引 倒排表 假设检验 全文索引 全民K歌 全链路压测 公平锁 关系 兴趣 内容挖掘 内容理解 决策树 冷启动 出轨 分层实验 分布式 分布式事务 分布式系统 分布式锁 分词 创业 加权融合 北京 区块 区块链 协同记忆网络 协同过滤 协方差 单元测试 博士 博士offer 压测 原则 双塔模型 反作弊 反欺诈 反脆弱 变量 召回 召回率 可观测性 可解释性 合约 后厂村 向量召回 向量检索 向量索引 吴恩达 命名实体识别 响应式编程 商汤科技 回归模型 因果分析 图像检索 图像识别 图数据库 图灵平台 图片翻译 图计算 在线学习 坐标回归 基于Netty开发服务端及客户端 基础支持层 增量学习 多多 多模态 多目标优化 大数据 大数据开发 头条 奥卡姆剃刀 学习 学习资料 学习资源 学会提问 实体识别 实时推荐 实时数仓 实时数据 实时日志收集 实时计算 实验平台 容灾体系建设 对比学习 对话系统 小城市 小米 小米搜索 小群效应 工作 布隆过滤器 帮帮 年轻人 广告 广告系统 序列标注 建模调参 开源数据集 开源项目 异常检测 异步IO 张嘉佳 强化学习 归一化 待分类 微服务 微软EXP 微软亚洲研究院 思维 性能优化 情感分析 意图识别 房租 技术 拆分 招聘 拼多多 持续交付 持续集成 损失函数 排序 排序模型 排队 推理系统 推荐 推荐理由 推荐系统 推送平台 提问的智慧 搜索 搜索广告 搜索引擎 搜索排序 搜索架构 搜索系统 支持向量 支持向量机 数仓体系 数仓平台 数据中台 数据仓库 数据分析 数据分析平台 数据同步 数据平台 数据指标 数据挖掘 数据治理 数据湖 数据科学 数据结构 数据集 数据驱动 文字识别 文摘 文本分类 文本情感分类 文本挖掘 文本纠错 文本表征 新闻推荐 方法论 日志架构 日志检索 时序特征挖掘 智慧物流 智能合约 智能客服 智能物流 智能语音 智能问答 智能预警 服务 机器学习 机器学习爱好者 机器学习面试题 机器翻译 机器视觉 机器阅读 条件随机场 架构 架构师 标签 标签平滑 标签识别 标签选择 校招 样本 核心处理层 检索引擎 槽位识别 模型剪枝 模型压缩 模型融合 模型评估 模型部署 模型预估 模式匹配 模式识别 正则化 注意力机制 洋码头 流批一体 消息队列 深度 深度兴趣网络 深度学习 深度树匹配 深度树检索 混排 混沌工程 火焰图 热点挖掘 熔断降级 爬虫 爱奇艺 牛顿-莱布尼茨 物流 特征工程 特征平台 特征系统 猜你喜欢 用户建模 用户画像 电商搜索 白兔 百度 相关系数 真话 矢量语义 知乎架构 知识图谱 知识增强 知识蒸馏 短文本解析 短视频 短语抽取 短语挖掘 碧桂园 神经网络 神马搜索 离线计算 秒杀架构 秒杀系统 程序人生 程序员 稳定性规范 空间索引 窗口函数 端上智能 端智能 算法 类协同训练 类目识别 粗排 索引 线程 线程池 缓存 网络图 置信度 美团 美团大脑 美团点评 职场 联邦学习 腾讯技术 腾讯音乐 自动化测试 自动驾驶 自然语言处理 色情识别 花椒直播 苞谷 蚂蚁金服 规则平台 规则引擎 视频推荐 计算广告 计算机视觉 认知 讨论区 记忆建模 记忆网络 论文 评价指标 评测指标 词向量 词嵌入 词权重 语义分割 语义匹配 语义检索 语义模型 语义理解 语言模型 语音内容识别 语音识别 谷歌面试 贝叶斯个性化排序 贝壳找房 贝壳智搜 货币化 起步 趋势科技 路径规划 软实力 边缘计算 达摩院 迁移学习 过拟合 逻辑回归 逻辑思维 采购 重叠实验框架 重排序 重构 金融 银汤匙 链表 链表求交集 阿里 阿里云 阿里妈妈 阿里小蜜 阿里达摩院 陈薇 陌陌 降纬打击 随机变量 零拷贝 面经 面试 项目管理 预估引擎 预训练 领域设计 领域驱动 风控 风控系统 高可用 高并发 高斯热图 高维数据索引 黄峥 黑盒模型

友情链接

其它