深度学习为什么需要工业化标准- 专知

深度学习为什么需要工业化标准

【导读】近日，深度学习作者Carlos E. Perez发表一篇博客，讨论了深度学习的工业化标准问题。我们知道，深度学习是当前AI领域的一个利器，其标准也不能照搬AI中的一般化标准。本文分别从互操作性、过程标准化、与人兼容性、伦理和对人类的益处几个方面讨论当前深度学习工业化标准，使深度学习不止存在于实验室之中，而且被工业界及其他的人所用。

Why Deep Learning Needs Standards for Industrialization

最近，我在思考一个问题：“我们应该如何定义AI的标准呢？”我主要关注于AI中深度学习这一领域。深度学习是人工智能中非常关键的部分。

AI这一术语起源非常久远，在半个世纪前就已经被提出了：

事实上，理解人类思维的想法甚至可以追溯到更早：

我们可以追溯到十六世纪的笛卡尔，甚至追溯到公元前322年的亚里士多德。

西方文明在理解人类大脑的工作方式方面已经积累了大量的知识。GOFAI近十年来的工作实际上是希望通过自顶向下的方式构建逻辑，以达到实现直觉与本能的目的。

现代计算之父——图灵，已经预料到了大脑的计算方式。在他逝世的14年之后，人们发现了他在未发表的论文中，构想了连接架构。在今天，这些架构更为人熟知的名字是深度学习：

http://www.cs.virginia.edu/~robins/Alan_Turing%27s_Forgotten_Ideas.pdf

因而，我想寻找的AI标准的问题，指的并不是所有被打上AI标签的方法的标准，而是希望找到深度学习的标准。

首先，问题是：“为什么我们需要标准？”标准是与互操作性（interoperability）相关的。所以在深度学习的语境中，什么是互操作性的意义，以及我们如何能得到更大的互操作性？自2012 年开始，深度学习的技术栈已经变得越来越引人注目了。

▌互操作性（Interoperability）

这是一个关于2018年深度学习技术栈的简单的画像：

其中并没有包括其他的必要要求，例如通用的数据工程和大数据技术；也没有包括整套应用解决方案中的某些部分，例如可视化层和激活学习层等。另外，深度学习具有广泛的前景，仍然在快速发展着。

从上图中，我们可以看出，许多已有的标准已经被考虑进来，并且可以被利用，所以人们已经有了一个相当大的启动平台去探索深度学习的标准化问题，而不需要依赖于AI中的其他领域。

互操作性标准不止对于全球社区特别重要，而且对于任何组织和国家同样特别重要。为了提高开发可扩展性，需要互操作性来最大化提高开发组件的可重用性。对于个人组织有一个重要问题：“对于独立的技术，我们该怎么划分界限？这是一个常见的问题”

相对独立的技术中，我们需要通用的术语。而在深度学习这个快速发展的领域中，我们却只有深度学习本体论：

Source: https://deeplearningplaybook.com

快速的获取研究的最新进展，并且将其应用于生产之中是非常有必要的。如果研究中使用的术语比较新的话，这将没有什么帮助。

▌过程标准化（Process Standardization）

我们也可以讨论下在技术层面之上的标准。将工业处理的观点应用于新的基于深度学习的系统。在2017年， Tianyu Gu, Brendan Dolan-Gavitt 和SiddharthGarg发表了一篇论文，“BadNets:Identifying Vulnerabilities in the Machine Learning Model Supply Chain”，为我们提供了一个很好的出发点，去讨论在训练深度学习系统中用到的数据质量。也许生物制造生产控制的想法（biotechnology manufacturing controls）会为我们提供更好的洞察力，或许这正是我们需要考虑的。

关注于处理控制也会带来一些问题，到底我们需要什么样的标准化才能充分考虑安全、性能、隐藏、正确、倾向、甚至隐私这些点。事实上，对于我们如何处理数据以及数据起源的问题，有很多可以讨论的。对于像深度学习这类方法来说，更为重要的是，他可以通过训练，直接从数据中学习到他的行为。

我们需要对深度学习实践进行标准化，不只是团队协作，而且还要能够对具有创意的解决方案进行单独开发，并将其集成到更大规模的处理之中。在传统软件开发之中，我们有许多成熟的框架，已经发展了很长时间。我们可以整合并加强那些不同的工具，如IDEs，代码检查，测试框架，连续整合，概述，性能监控等等。深度学习采用了新的要求，所以我们需要去理解这些到底是什么，并且将需要的工具种类标准化出来。

▌兼容性（Human Compatibility）