深度学习时代的图模型 2022年3月15日 他们将现有方法分为三个大类:半监督方法,包括图神经网络和图卷积网络;无监督方法,包括图自编码器;近期新的研究方法,包括图循环神经网络和图强化学习。然后按照这些方法的发展史对它们进行系统概述。该研究还分析了这些方法的区别,以及如何合成不同的架构。最后,该研究简单列举了这些方法的应用…… 阅读全文
为什么正则化能够缓解模型过拟合并使得模型更简单 2022年3月15日 公众号:月来客栈,欢迎关注!微信: nulls8 模型产生过拟合的现象表现为: 在训练集上误差较小,而在测试集上误差较大。并且笔者还说到,之所以产生过拟合现象是由于训练数据中存在一定的噪音,而我们为了尽可能的做到拟合每一个样本点(包括噪音),往往就会使用复杂的模型。最终使得训练出来的模型很大程度…… 阅读全文
所有机器学习项目都适用的检查清单 2022年3月15日 作者:Harshit Tyagi 编译:ronghuaiyang 导读 构建端到端机器学习项目的任务检查清单。 Image for post我正在创建一系列 有价值的项目,我想到了将我从别人那里学到的或在工作中开发的实践记录下来。在本博客中,我整理了在处理端到端ML项目时经常提到的任务清单。 为什么我需要一个清单? 因…… 阅读全文
优酷视频元素内容召回系统多级多模态引擎探索 2022年3月15日 分享嘉宾:崇懿 阿里文娱 技术专家 编辑整理:李沛欣 内容来源:阿里文娱技术 出品平台:DataFunTalk 导读: 多级多模态引擎是为推荐搜索定制的专业化的召回引擎。优酷视频搜索在基础的文本Query搜索系统的基础上,不断探索视频搜索的特色,在多模态输入、多级多模态索引、跨模态检索上积累很…… 阅读全文
深度学习在同城租房搜索排序的应用 2022年3月15日 导读:深度学习得益于良好的深层特征表达性,目前在视觉、文本、语音等领域获得了广泛的应用。搜索领域紧贴用户需求,作为深度学习商业变现最成功的路径之一,众多头部企业发展出了许多优秀的应用。58同城是国内最大的生活信息服务平台,涵盖房产、招聘、黄页、二手车等多个业务,在多个业务线的搜索…… 阅读全文
机器学习中的特征工程总结 2022年3月15日 译者:张峰 ,Datawhale成员 特征工程 传统编程的关注点是 代码。在机器学习项目中,关注点变成了 特征表示。也就是说,开发者通过添加和改善特征来调整模型。“Garbage in, garbage out”。对于一个机器学习问题,数据和特征往往决定了结果的上限,而模型、算法的选择及优化则是在逐步接近这个上…… 阅读全文
可解释机器学习发展和常见方法 2022年3月15日 来源:新智元,编辑:数据派THU 本文介绍IML领域的历史,给出了最先进的可解释方法的概述,并讨论了遇到的挑战。 近年来,可解释机器学习(IML) 的相关研究蓬勃发展。尽管这个领域才刚刚起步,但是它在回归建模和基于规则的机器学习方面的相关工作却始于20世纪60年代。最近,arXiv上的…… 阅读全文
腾讯信息流内容理解技术实践 2022年3月15日 分享嘉宾:郭伟东 腾讯 高级研究员 文章整理:李传勇 内容来源:DataFunTalk 出品社区:DataFun 导读: 目前信息流推荐中使用的内容理解技术,主要有两部分构成:1. 门户时代和搜索时代遗留的技术积累:分类、关键词以及知识图谱相关技术;2. 深度学习带来的技术福利:embedding…… 阅读全文
高精准低成本九章云极突破难题 2022年3月15日 2021 年世界人工智能大会(WAIC)于 7 月 8 日 在上海世博中心拉开帷幕。 九章云极DataCanvas董事长方磊受邀参加由世界人工智能大会组委会主办、机器之心承办的“2021 WAIC·AI开发者论坛”,并发表“Hypernets:自动化机器学习的基础框架”主题演讲。 本次论坛以「后深度学习…… 阅读全文
值的解释以一种你期望的方式解释给你听 2022年3月15日 作者:Samuele Mazzanti 编译:ronghuaiyang 正文共:3096 字 13 图 英文原文: https://towardsdatascience.com/shap-explained-the-way-i-wish-someone-explained-it-to-me-ab81cc69ef30 导读: 上一篇文章 我们说到 SHAP 值可以用来对黑盒模型进行解释,具备比简单的逻辑回归更好的实际意义,那么 SHAP 值到底是什么?有什么实际意义?如何计算? 揭开神秘的面纱 在上次的文章中,我们看到 SHAP 值可以用来解释机…… 阅读全文