对话Matt Zeiler: 也许Clarifai可以上演大卫和歌利亚的故事

2019 年 2 月 9 日 机器之心

机器之心原创

机器之心（海外）编辑部

Matthew Zeiler，Clarifai 创始人兼首席执行官，机器学习博士，应用人工智能（AI）领域的思想领袖先驱。Matt 在计算机视觉领域的开创性研究，与著名机器学习专家 Geoff Hinton 和 Yann LeCun 一起，将图像识别行业从理论推向了现实世界。自 2013 年启动 Clarifai 以来，Matt 将其屡获殊荣的研究发展为开发人员友好型产品，使企业能够快速无缝地将 AI 集成到他们的工作流程和客户体验中。今天，Clarifai 已成为领先的 AI 公司，并且「被广泛认为是机器学习中拥挤、喧嚣领域最有前途的初创公司之一。」（福布斯）

在这篇文章中，机器之心 (Synced) 与 Clarifai 创始人兼首席执行官 Matt Zeiler 开展了关于计算机视觉领域的最新进展以及展望 Clarifai 未来的谈话。

（以下为对话原文，机器之心做了不改变原意的整理。）

根据您对过去一年的观察，您觉得计算机视觉领域的趋势是什么？

大概始于 2017 年，到 2018 年，我认为在图像生成方面出现了很多有趣的成果。我们看到了模型生成的非常逼真的内容，它的价值在于基于非常少的信息实现自动生成场景渲染。比如你可能只有分割掩码，说这个区域有一条路，那里有一辆车，那里有一棵树，然后模型可以渲染出很逼真的目标实例。你甚至可以将渲染图像用作训练数据，这是非常令人兴奋的。因为你可以生成一堆数据，然后用它来教一个新的 AI 模型如何识别事物。

我们 Clarifai 非常热衷的另一件事是在边缘设备上运行这些 AI 模型，无论是在 iOS 或安卓设备或物联网摄像头，还是内部服务器等移动设备上。无论客户想要在哪里运行 AI，我们都希望能够实现。我们也观察到了在 AI 领域中的其他人进行着类似的动作，他们围绕压缩模型进行了大量研究，使 AI 模型变得更高效，以便在以上这些类型的新处理器上运行。

在 2019 年，您对视觉识别技术和其相关应用的发展有何期望？

首先，边缘计算将变得非常非常重要。到目前为止，人们一直在使用内置于设备中的 CPU 和 GPU。但是进入下一年，将会开始出现更多可用的专用硬件。我们实际上正在研究如何在为 AI 构建的特定专用硬件上运行应用，这些硬件只有非常低的功耗，并且实现了非常快的处理速度。

另外是，更聪明地将不同的数据类型融合在一起，不仅仅在图像或视频的像素上应用计算机视觉技术，而是将其与相关的其它类型数据融合在一起。如果你想搜索不同颜色的衬衫，颜色会是附加信号；或不同的袖长，这又是另一个附加信号；或者不同的价格范围等。我们能否以整体的方式理解所有这些不同类型的数据，以便人们更好地理解和提取数据的价值？我认为这是我们所期待看到的趋势。

您能总结一下 2018 年 Clarifai 的进步或突破吗？

我们做了关于将计算边缘化的一些工作。我们现在提供 iOS、安卓和内部的 SDK，因此我们可以在几乎任何设备上运行，它们都能连接到我们的云。我们的用户界面可以管理客户的数据和训练模型，然后客户就可以在任何需要的地方运行它们，这对客户来说是一个巨大的增值。作为一个平台，它们可以无缝协同工作。

此外，我们已经启动了一些构建目标检测模型的工作，在上周推出了最新版本的人脸检测模型。我们现在能看到的这些巨大飞跃，是因为我们正在收集越来越多的训练数据和算法，使模型变得非常准确。

与计算机视觉领域的其他核心企业相比，特别是在视觉搜索市场和图像识别市场，您认为 Clarifai 的相对优势是什么？

让平台变得无缝衔接实际上是一个小公司的一大优势，不同的产品团队实际上是彼此相邻的。虽然我们的竞争对手比如谷歌、微软、亚马逊，它们非常庞大，因此很难协调来构建无缝衔接的平台。我们可以直接面向客户解决他们想要在业务中遇到的问题，完成整个 pipeline 上的所有工作，包括收集更多训练数据、标记数据、训练模型，将模型部署到他们需要运行的任何地方，还可以随着时间的推移对其进行迭代和改进。

2019 年 Clarifai 的主要关注点和计划是什么？

我认为有三个。一个是边缘智能化，我喜欢称之为 Smart X：智能家居、智能企业和智能商店等，这是一项物理世界中的计划。

另一个是数字化洞察。在过去五年中，这是我们关注的重点：了解消费者的生活照片、旅行照片、地产信息等内容。我们将在搜索产品上加倍努力，真正从大量数字内容中获取洞察力，将其切分并从中提取信息和价值。

最后一个是推动平台的采用。多年来，我们先从一刀切的模型开始，为旅行、婚礼、食品等这些特定的场景建立了一些应用模型。在我们开放平台以允许自定义分类模型后，用户粘性确实得到了增长，开发人员和用户的数量也得到了增长。因此，我们将在平台中启动更多自定义，并开放更多平台。

一直以来，Clarifai 在计算机视觉领域的技术实力得到广泛认可。去年，Clarifai 推出了增强型通用模型，这是你们迄今为止最智能、最多样化、最强大的模型。您打算如何在现有技术和产品上进行创新？

这是我们通用模型公共版本的第五次迭代。我们正在收集越来越多的来自各种不同来源的训练数据。其中一个非常重要的来源是我们实际的 API 流量，我们正在进行一些研究，以便能够利用未标注的流量。它们是一些图像或视频，我们希望能够对其进行自动学习，让通用模型的下一个版本可以自己学习。有很多研究让我感到非常兴奋，因为人工智能的圣杯其一是半监督或无监督学习，即不需要人类干预。我们现在从中获得了一些非常有趣的研究结果，显示出无需人类干涉即可出现的性能改进。

在技术上，Clarifai 需要克服哪些挑战才能实现更好的性能？

总体上有两个，数据方面的挑战和算法方面的挑战。我认为算法方面不太重要，说实话，因为研究界在发布新想法方面非常强大，而且这些想法大多数是算法，因为正在进行的研究是针对固定大小的数据集。ImageNet 非常受欢迎，还有 COCO。这些类型的数据集非常适合研究社区，因为他们可以提出新的算法思想，我们从中受益。算法出现后，我们将它们放入我们的技术堆栈中并对其进行迭代，然后添加自己的想法使它们变得更好。这得益于整个研究社区和我们的研究团队。

然后数据方面，我认为必须进行大量创新，以使用更少的数据也可以实现优秀性能。我们做的一件事是分类自定义训练，允许新用户进入一个平台，并且不需要一百万张图像就能从中获得好处。训练仅需少量数据，而且训练不需要像平常那样花费数周时间，只需几秒钟。对于人们来说，为他们自己的应用程序构建 AI 会是一个更快、更容易的过程。我们在数据方面和工程方面进行了大量研究才使其变得非常快，我认为这就是 Clarifai 能有独特创新的原因。

您最近关注的技术有哪些？哪些工业应用方向是您最重视的呢？

我们已经考虑了许多关于区块链和分布式网络以及隐私保护的问题，我认为这些非常重要，因为我们正在致力于边缘计算。另外还有很多核心基本问题需要解决，才能使 Clarifai 这样的产品真正有用。

其次，我一直很喜欢消费类电子产品，几周前我们刚刚在拉斯维加斯的消费电子展 (CES) 上展示了我们在 Smart X 计划中的一些新成果，例如实时运行安全摄像头和运用热点地图识别人们在商店中的走动区域等。

您认为未来还有哪些其他新的技术方向是需要探索的呢？

五年前，我在纽约大学攻读博士学位后创办了 Clarifai，而我当时的博士学位是百分之百专注于图像理解的。如今我们已经扩展到视频方面，而从长远来看，我还想扩展到音频、文本和其他类型的数据。我认为开始做我之前提到的「对整体的理解」非常重要，这就是我看到的 Clarifai 的未来发展方向。

2018 年，AI 和计算机视觉技术侵犯人权和获取私人信息的问题得到了人们的普遍关注，同时数据偏见仍然是困扰 AI 研究人员的挑战之一。请问这对您的业务有何影响呢？

我认为其中非常重要的一点是人工智能将在多个维度超越人类能力，如准确性、速度、可处理的数据规模以及作出更好和无偏见的判断方面。围绕人脸识别的许多争论涉及执法等应用，例如运行带偏见的分类器可能会导致判断错误。

但你必须考虑到，今天在人类系统中每个人都有自己的偏见。他们感到疲倦，感到饥饿，感到压力, 然而这些都不会发生在机器上。所以，随着时间的推移，随着我们收集越来越多的训练数据，像 Clarifai 这样专注于训练模型的公司可以使模型做到与专家一样无偏见，我们将把这些模型带入真实世界，这与任何一个随机选择的执法人员相比，会产生更好的判断力。从长远来看，人工智能会变得更好。我认为很多人不了解人工智能在公共社会中的角色和意义，一旦你理解了，就能更好更容易地明白人工智能应用的价值。

Clarifai 是否有中国合作伙伴或客户呢？

有的，我们在中国有一些使用我们 API 的客户。其中黄油相机（ByButter）就是其中比较大的一家客户。实际上我从未与他们交谈过，但从我的理解来看，他们是像 Instagram 那样的应用程序，这个应用程序叫「ButterCam」。

对于这些消费者应用程序，有两件事是我们可以帮助解决的。一个是组织内容上，在用户上传和创建内容时对其进行标记，以便其他用户可以找到它；另一个重要的应用是内容节制。每当有用户上传内容时，你需要过滤掉类似裸体、毒品和武器这样的东西，这些是我们可以帮助像 ByButter 这样的公司做的事情。

你对三年后的 Clarifai 有何期待？

我们正在尝试建立领先的人工智能平台（正如我前面提到的那样），扩展到其他数据类型，在边缘设备上运行大量计算，并且真正面对强大的竞争对手——那些技术巨头们。我们认为小型和初创公司有很多独特的优势，我们百分之百专注于人工智能，而不像那些同时拥有零售店和其他一百个部门的大公司。

我想也许我们可以上演大卫和歌利亚的故事（David and Goliath），小麻雀也有大力量。