知识蒸馏如何用一个神经网络训练另一个神经网络
作者:Tivadar Danka 编译:ronghuaiyang 导读: 知识蒸馏的简单介绍,让大家了解知识蒸馏背后的直觉。 如果你曾经用神经网络来解决一个复杂的问题,你就会知道它们的尺寸可能非常巨大,包含数百万个参数。例如著名的BERT模型约有1亿1千万参数。 为了说明这一点,参见下图中的NLP中……
专注于Android、Java、Go语言(golang)、移动互联网、项目管理、软件架构