2022年3月15日
事务特性 ? • 原子性: 事务是最小的执行单位,不允许分割。事务的原子性确保动作要么全部完成,要么完全不起作用; • 一致性: 执行事务前后,数据保持一致; • 隔离性: 并发访问数据库时,一个用户的事物不被其他事物所干扰,各并发事务之间数据库是独立的; • 持久性: 一个事务被提交之后。它对数据库中数……
阅读全文
2022年3月15日
文末彩蛋:七月在线干货组最新升级的《2021大厂最新AI面试题 [含答案和解析, 更新到前121题]》免费送! 问题1:python在内存上做了哪些优化? python通过内存池来减少内存碎片化,提高执行效率。主要通过引用计数来完成垃圾回收,通过标记-清除解决容器对象循环引用造成的问题,……
阅读全文
2022年3月15日
背景 在 CTR/CVR 预估任务中,除了 FM 模型[2] 之外,后起之秀 FFM(Field-aware Factorization Machine)模型同样表现亮眼。FFM 可以看作是 FM 的升级版,Yuchi Juan 于 2016 年提出该模型,但其诞生是受启于 Rendle 在 2010 年发表的另一个模型 PITF [3](FM 也是 Rendle 在 2010 年发表的),其论文原文 [1] 中写道: The idea of FFM originates……
阅读全文
2022年3月15日
作者:Alessio Gozzoli 机器之心编译 参与:朱乾树、张倩 整天 babysitting 深度学习模型是不是很心累?这篇文章或许能帮到你。本文讨论了高效搜索深度学习模型最佳超参数集的动机和策略。作者在 FloydHub 上演示了如何完成这项工作以及研究的导向。读完这篇文章后,你的数据科学工具库将添加一些强大的新工具,帮助你为自己……
阅读全文
2022年3月15日
这里是[「王喆的机器学习笔记」]的第十九篇文章,这篇文章要谈的是 推荐系统的优化目标 的问题。作为一名算法工程师来讲,最关心的往往是模型的创新、技术的演进。笔者在最开始工作的几年,也经历过这样的阶段,执着的追求于应用最新的技术,追踪最新的paper,更新最新的机器学习工具。这样持续学……
阅读全文
2022年3月15日
作者 : 高沛, 2018年7月加入去哪儿网,目前负责酒店搜索、门票搜索、大搜等搜索相关业务,曾参与基于Lucene的搜索召回服务搭建,个人对搜索引擎、分布式技术比较感兴趣,喜欢探究技术内幕、深入了解底层原理。 1 前言 Lucene 作为 Apache 开源的一款搜索工具,一直以来是实现搜索功能的神兵利器,现今火热……
阅读全文
2022年3月15日
分享嘉宾:观宙 阿里飞猪 算法专家 编辑整理:王吉东 出品平台:DataFunTalk 导读: 在飞猪搜索CPC广告业务中,广告策略不仅需要考虑CPC消耗和广告主ROI,平台整体营收 ( 即CPC消耗+自然交易抽佣 ) 也是不能忽略的优化目标。传统上基于广告pCTR、pCVR、bid等因子的策略算法……
阅读全文
2022年3月15日
版权声明 作者:李铁牛 本文为InfoQ原创投稿。 移动互联网广告基于大数据,实现广告的精准人群定向投放和效果评估,并借助于不可胜数的广告策略,控制着广告的实时投放,让数据驱动型的移动互联网广告沿着站方、用户、广告主三者共赢的目标不断前进。 大数据驱动使得效果指标的量化评估成为了可能。为……
阅读全文
2022年3月15日
本文主要介绍项目中用于商业兴趣建模的DSSM双塔模型。作为推荐领域中大火的双塔模型,因为效果不错并且对工业界十分友好,所以被各大厂广泛应用于推荐系统中。 通过构建user和item两个独立的子网络,将训练好的两个“塔”中的user embedding 和item embedding各自缓存到内存数据库中……
阅读全文
2022年3月15日
稿|三余 一、前言 模型部署作为算法工程落地的最后一公里,其天然对算法团队而言具有较高的复杂性,不仅要考虑如何高效地部署、管理不同框架模型,还需要考虑分布式服务的负载均衡、故障容错、可扩展性、资源隔离、限流、核心指标监控等问题。这些都极大的依赖于工程团队的能力,不是算法团队的强项,如……
阅读全文