两年追踪170个AI团队的原型设计：初创公司该选择做研究还是做外包？

2017 年 10 月 20 日 AI前线 周末前的坚持

作者｜Matthäus Krzykowski

译者｜核子可乐

编辑｜Vincent

本文作者在研究驱动型团队生态系统的过程当中，总结出以下经验：

1. 研究驱动型团队在初创领域开始越来越多地扮演生力军角色。ArXiv 则是新型实现方法模型推广领域的一大卓有成效的实例。

2. 尽管如此，大多数研究型初创企业仍然作为大型企业的外包研究团队存在。

为了实现产品与市场间的契合，这些初创企业首先需要专注于数据时间，并在开始测试数据获取战略之前保证实现快速迭代。

更多精彩文章请添加微信“AI 前线”（ID：ai-front）

关注人工智能的落地实践，与企业一起探寻 AI 的边界，AICon 全球人工智能技术大会火热售票中，6 折倒计时一周抢票，详情点击：

https://aicon.geekbang.org/apply?utm_source=wechat&utm_medium=ai-front

帮助研究驱动型原型设计团队成为初创企业带来的意外收益

两年之前，一位朋友鼓励我以导师身份参加柏林 Techstars 首届选择日活动。自那时开始，我就一直作为 Techstars 导师不断帮助“深度技术”（对我个人而言，这一表述专指大规模并行处理（简称 MPP）数据库、人工智能（简称 AI）/ 机器学习（简称 ML）以及开源企业）初创企业由原型设计阶段顺利过渡至产品与市场相契合的层面。在参加柏林 Techstars 首日活动时，我结识了 Rasa 团队——时至今日，我已经成为 Rasa 团队的投资人兼运营顾问。Rasa 如今则成长为市场上开源对话 AI 软件领域的领导者，其去年 12 月推出的首款 NLU 工具已经得到数千家企业的使用。

然而，Rasa 其实属于一种例外，事实上我所见到的大多数的初创企业仍处于原型设计阶段。从定义角度来讲，他们的原型设计尚未完成。

原型设计显然不足以令风险投资商满意。不过，打造新事物对于初创企业而言，在价值上要高于提供演示或者发布市场研究结论。全程追踪数十套原型设计方案在特定领域遭遇的难题以及茁壮成长的经历，正是我不断完善自己投资水平的主要学习资源。

颠覆性成果距离很远，但特定应用却距离很近

举例来说，从研发角度来讲，颠覆性成果似乎已经离我们不远——历史上对于 AI 的研发目标一直在于超越人类的智慧水平，并给整个人类社会带来难以想象的深远革命。但从另一方面看，第一代聊天机器人给我们带来的用户体验几乎可以证明，这样的深远革命确实够“远”。深入观察，我们只看到了数十款不再以规则为基础的机器人方案。相比之下，过去两年当中则出现了超过 170 多种更为出色的原型设计——其确实在一定程度上实现了 AI 超越人类的奇迹，只不过仅限于特定行业垂直领域内的专业应用，即在非常具体且狭义的任务上实现这样的效果。

平台并不足以消化这一切

另一项深受认同的论据，认为各大（美国与中国）互联网平台将在本质上“拥有”多个行业 AI 市场。这是因为“AI 是一类强者愈强的行业：你拥有的数据越多，产品就越好 ; 你的产品越好，能够收集到的数据越多。”这样的结论在一定程度上的确属实，具体包括图像识别、自动驾驶车辆、语音到文本以及基本上任何人皆倾向得出“正确”答案的应用场景。然而，很多问题并不具备惟一的正确答案。因此如果大家尝试利用机器学习构建新型内容，或者利用数据学习新的内容，那么这将建立起完全不同的市场体系，且其中完全能够容纳众多垂直赢家。

另外，数据本身的作用其实并不像以上论点当中表达的那么显著。

根据我所看到的诸多原型设计，我发现利用以往数据进行神经网络训练其实实践价值相当有限。

虽然这也许有助于加速初始原型设计，但也就仅限于此了。大型企业可能确实掌握着多年以来的消费者数据与交互记录，但在对神经网络进行训练时，其仍然需要从头开始。初创企业的竞争环境则更令人惊讶。在我看来，财富五百强企业中的大部分都已经意识到，AI 实现方案所需要的数据量要比他们想象的少得多。

除此之外，我还发现这些研究驱动型团队存在两大主要趋势：其一是这些研究型团队经常受到科学论文平台 ArXiv 社区的启发，且目前开始迈入初创阶段。在大多数情况下，他们都作为大型集团的小规模外包研究型团队存在。

ArXiv 启发下的研究型团队逐步迈入初创舞台

也许正是由于存在这样一个公平的竞争环境，才促使众多研究驱动型团队参与到柏林的初创市场当中。

这一切对于柏林亦属于新鲜事物。柏林的初创环境长久以来一直以学生创业为主要表现形式，并培养起大量来自本地的所谓“运营型”初创企业。Rocket Internet 公司的成功凭借的是他们自身的才能以及硅谷对于市场上现有技术的漠视。然而，如今此类机遇似乎已经不复存在。但包括我自己建立的 Xyo 公司在内的各类研究型初创企业则成为一种宝贵的例外。很多人并不知道，柏林充斥着大量独立的开发人员。他们既可以在公司内工作，也可以参与一些业余爱好性质的项目，甚至成为柏林当地各企业的外包商。从 2011 年开始，我记得 Android 团队的 Reto Meier 就开始邀请我参加柏林的 Android 大会，这一活动吸引到了超过 1500 名开发者。除我之外，没有任何一家柏林当地初创企业参与其中，在这里出现的只是一群充满爱好与热情的开发人员。

这样的情况目前仍然存在。走出校园的博士们仍然将主要德国企业（包括工程、银行、金融以及各类中型企业）作为就业目标。然而，我们现在已经拥有了一波根基稳固的研究型创始者群体。另外，他们中有很多人来自柏林以外的地区。在我们遇到的 170 个团队当中，有超过六成来自柏林之外（我们分别与来自剑桥、伦敦、爱丁堡、波茨坦、图宾根、卡尔斯鲁厄、苏黎世以及华沙的博士团队见过面）。事实上，来自美国与亚洲的众多研究团队同样相当活跃且令人瞩目。柏林能够仅以 4000 欧元的成本养活一支包含三位成员的技术团队，这样的物价水平在全球范围内都极具竞争力。

受 ArXiv 启发的初创企业的兴起

人们一再向我强调，研究型团队转化为初创企业的另一大动力在于，初创企业如今面对着应用研究领域的巨大发展空间——事实上，初创企业的研究方向相较主流企业要更为自由且灵活。

以开放性的心态进行方法共享、讨论与辩论，再加上开源成果的快速采用周期（几乎能够立即发布在 GitHub 之上）使得初创企业对研究人员而言极具吸引力。网络论坛与各类平台也一直在推动这一观念，即没有任何其它企业能够像 ArXiv 这样充满活力——在这一由康奈大学最初建立的在线科学论文库平台当中，各类团队能够随意参与各类讨论。这里为研究人员提供的生活方式——即随时发布他们的想法 / 研究成果并进行公开参与——能够带来极强的鼓励性作用。人们对此通常抱有一种（误导性）假设，即初创企业能够给研究人员提供远胜过高校或者大型企业的自由发挥空间。一般来讲，AI 团队只负责发布研究成果，而无需考虑构建具体产品或者商业模式——他们只需要等待收购即可。

要驳斥这样的固有观念，我们可以列举一个实例——Prisma 应用如今已经拥有极高人气，其允许用户根据主题将一幅图片的风格转换为另一种完全不同的形式。

最初，一组来自图宾根大学 Bethgelab 的研究人员于 2015 年 9 月发表了一篇题为《艺术风格中的神经算法》的论文。

此项研究立即得到了关注，并在几天之后开始在 GitHub 上进行应用程序开发。相关的高人气论文及应用程序不久后开始陆续出现，且直到今天仍拥有相当的热度。到 16 年 6 月，Prisma 应用由数位俄罗斯年轻人开发完成，并在被引入 Facebook Feed 后得到了公众的广泛认可。

目前人们普遍认为，Prisma 的广泛普及使得公众开始对神经网络的应用方向抱有好奇心。但在另一方面，这也为初创企业指出一条新的发展途径——先面向公众，而后面向研究社区。

突然之间，很多人开始将初创企业视为一种理想的工作选择。最终，Bethelab 团队也建立起一个 Prisma 风格的网站。据我所知，至少有 15 家初创企业的灵感源自 ArXiv 上发表的论文。更多初创企业则通过 ArXiv 建立起尝试实业的信念。

正如 Roobie Allen 所言，这是一场 ArXiv 启发下初创企业的崛起浪潮：

“与大多数其它技术相比，AI 的关键在于其强大的学术研究背景。（……）不同于在获得支持之前长期停滞的创新或者等待倾向，绝大多数 AI 研究成果皆基于为期仅数个月的工作以及有限的代码量。其中的关键在于尽快将思路提交至社区，以便其他人能够对其加以改善（并在他人做到之前确立思路的归属权与地位）。”

ArXiv 启发型初创企业的局限

与此同时，AI 研究与进展不仅体现在风格转换层面，同时亦在视觉与图像建模领域拥有出色表现（具体包括图像识别、视觉问题回答、图像语义标签、视频识别以及图像生成等）。书面与口头语言的研究工作在活跃度与开放性方面相对较低，机器学习系统在这两方面的水平则更为有限。

举例来说，没有人会在推文当中像 Alex Champandard 或者 Nicholas Guttenberg 那样讨论自己的思路 / 研究成果。语言本身也非常复杂，这是因为其与族群状态关系密切。有人认为深度学习将彻底解决自然语言处理（简称 NLP）问题，意味着大家不再需要学习语言知识。然而，计算机语言学家们在面对计算机视觉 / 深度学习研究人员时却显得非常无力——他们对文本数据进行了一些实验，并发现自己根本无法在自然语言处理层面拿出同样份量的成果。

服务于大型企业的小规模外包研究团队仍面临挑战

对于大多数此类团队而言，通往初创企业的转型之中和仍然挑战重重。其中部分挑战属于创业工作当中的“常态”，换言之大部分此类团队都会提出类似的问题。

其中还存在一些具体的模式。就我所见到的情况，超过九成的 AI 原型设计方案以企业为中心，而非以消费者为中心。在这样的引导之下，相关团队大多数会将少数大型企业（买家）作为目标客户。

在这种意义上，此类团队更应被视为“企业外包研究机构”，而非真正具有爆炸式增长潜力的“风投级初创企业”。正视并深入探讨这个问题显然不是什么坏事。就 2017 年来看，大量成规模的企业开始与初创公司合作。在柏林，目前存在着超过 160 个企业加速器与创新团队。而本地也存在着不少受众，愿意为这些年轻团队的聪明才智买单。

给大家举个实例。最近，我发现一家初创企业正在与两家物联网冰箱制造商合作。就具体功能而言，这些冰箱产品在关门之后，其中的内部摄像机将能够帮助用户查看存放内容。其中一部分产品可以实现条码识别，但另一些则不能。接下来，这些日常数据将被发送至厂商处进行分析。

毫不意外，这家企业希望将 “大数据”作出的模糊承诺转化为更具体的收益。

这家企业无法弄清如何追踪 ETL 问题并在内部将数据转化为实际价值。这就给我们的研究人员带来了创业机遇。在实际接触中，这家初创企业提出了很多关于解决各类挑战的好办法。其中之一在于建立一套出色的模型，而后设计训练神经网络以识别各类品牌标志图像，最终以此为基础构建部分分析功能。

对于研究驱动型团队而言，达到上述目标已经相当值得称道，更遑论其能够通过自己的工作获得报酬。然而，他们只是重复了以往他人已经实现过的成绩，因为这样的结果并不足以使其成为风投眼中的黄金“初创企业”。虽然他们仍有可能成为未来的初创明星，但就目前而言，其方案仍然只是一种早期原型，且其堆栈与初始代理客户端当中仍存在不少漏洞。与他人一样，Eyeem 公司的 Ramzi Rizk 也认为：成为一家符合风险投资要求的 AI 初创企业其实非常艰难。

未来展望：时间到数据与快速迭代

那么这些小型外包研究机构要如何才能发展为真正的初创企业？以下两项目标值得大家加以借鉴。

时间到数据

正如 AI 风投方 Merantix 公司的 Rasmus Rothe 所言：

“在机器学习学术界，人们几乎不会关注数据集的获取方法。相反：为了将深度学习技术与其它方法相比较，同时确保其中一种方法优于另一种方法，标准流程要求以相同的评估程序来衡量标准数据集的处理成效。然而在现实世界当中，新型算法与其它方法相比在成效方面反而下降了 1%。这里的重点在于构建起一套强大的系统，确保其能够以足够的准确性解决所需任务。对于一切机器学习系统，这都需要进行标记训练，并帮助算法以此为基础完成学习。”

实际上，人们可能往往会假设能够实现 AI 突破的关键性算法如宝藏般静静躺在某处，等待着研究人员通过大量高质量数据集将其从现有文献当中挖掘出来，而后立足当前可用的硬件加以针对性优化。

在演讲当中，我通常建议此类机构依靠以下方式运行测试。

让企业付费以确保研究工作的正常运行。
坚持投入同样的时间服务于其它客户。

在这些“其它”客户当中，需要优化的重点在于获取数据的时间。对于那些愿意测试自己粗糙的 beta 原型方案并提供反馈的朋友而言，这无疑是一种福利。通过这种方式，我们通常能够与其它初创企业（以免费方式）进行初步对接，而后与这些小型且通常由初创者主导的年轻公司组队，从而在无需正式数据获取流程的前提下作出明智决策。

更快迭代周期

另一条建议则与数据分析相关。在这方面，大家需要找到哪些模型能够确切实现效果，而哪些模式适用于特定数据集。

这意味着研究团队不可能以上百万个数据点为规模进行运营，因为这将带来 3000 甚至是 10000 套数据集。相反，着眼于数据并发现模式才是最好的选择。

其中最简单且成本低廉的处理方法就是在 AWS S3 存储桶上执行无服务器 MySQL 查询，或者立足 Redshift 构建起一些简单项目。如此一来，各研究团队即可将大量数据导入 AWS 并运行 SQL 查询，最终查看这些重要模式——而无需自行构建基础设施。

到这里，研究团队需要投入更多时间对数据进行整理（占总体工作时间的七成到九成），而后发现模式并在短时间内构建起算法。对于大多数研究型初创企业而言，这种作法与直觉存在冲突。然而，通过这样的方式，研究团队将能够在两到三周之内顺利前往下一次组队迭代——而非像以往那样耗费更长时间。

一旦找到志趣相投的组队伙伴，接下来就可以审视初创企业的数据收集策略并调查其可行性。事实上，通过计算得出这些数据策略很可能是研究型团队所面临的、最为艰巨的反直觉挑战。

事实上，其中一些策略甚至可能引起争议，并让整个团队重新思考是否还应继续朝着初创企业努力。以 Babylon Health 为例，这款聊天机器人应用允许用户在无需亲临诊所的前提下就自身症状提出问题，且最近筹集到 6000 万美元。该团队认为，“Babylon 的科学家们预测称，我们将能够很快实现比医生更出色的个人健康问题诊断与预测能力。”在西方世界当中，从诊断到健康状况预测涉及大量数据、科学、法律以及商业化问题。

不过单纯从技术角度来讲，医疗团队确实能够打造出一套比人类更强大的特定健康问题检测或预测方案。如果能够在理论层面将诊断准确率由 30% 提升到 60%，即可拯救许多鲜活的生命。然而，40% 的准确率时可能出现的诉讼足以毁灭初创企业的发展道路。也正因为如此，众多医疗卫生团队选择在数据保护措施较弱或者被起诉可能性较低的国家进行早期实验。举例来说，Babylon Health 在卢旺达拥有 45 万名用户。而西方各国的健康预防相关组织则通过各大型企业处理医疗系统及健康预测的监管工作。

到这一阶段，研究型团队亦开始需要转化为数据驱动型团队。

数据是否（仍）未实现民主化？

可以理解的是，Zeroth.ai 公司（AI 创新初创企业之一）的 Tak Lo 认为“数据鸿沟是 AI 创新所面临的最大威胁”，并极力呼吁数据民主化。

Tak 呼吁建立一套类似于维基百科的 AI 数据库，这也从一个侧面证明如今 AI 研究团队的主要挑战也许正在于数据访问能力。各团队创始人在努力为合法技术或金融技术等平台当中的垂直领域构建特定用途的产品，并希望借此回避与谷歌或者微软等技术巨头的直接竞争。

然而总体而言，如今的数据还远没有实现民主化。尽管近来人们正在为建立数据民主化平台而纷纷发声，Helix 等垂直应用商店也得到陆续启动，但 AI 当前仍没有达到“苹果 App Store”这一彻底实现移动开发与发布民主化的重量级成果的级别。

我们才刚刚踏上征途

目前对于研究驱动型团队而言堪称理想的历史时机，大家可以将自己的想法塑造出来，并在创业领域当中进行测试。而我们也将越来越多地看到 ArXiv 在其中发挥的重要促进作用。相当一部分研究团队未来将继续作为大型企业的外包机构进行工作，单就这一点而言已经是一项了不起的成就。而其中一部分团队还将进一步发展：找到自身产品的市场适应度，同时发现最佳数据收集策略，最终彻底改变世界。

作者简介

Matthäus Krzykowski，作为专司初创企业业务的运营顾问，过去两年以来，我在柏林关注过围绕 AI/ML 与 MPP 数据库建立起 170 多个原型设计研究团队。

原文链接

https://medium.com/techstars/the-ai-race-to-the-top-observations-on-research-driven-teams-berlin-arxiv-4e14fee9d28e