可能很多朋友都听说过一句俗谚,即“宁为太平狗,不为乱世人”。然而,事实证明中国人对这样的处世哲学并不完全认同——英国正常有奥斯汀 - 张伯伦(Austin Chamberlain)在上世纪三十年代提出了这一英文表述(May you live in interesting times),并称其为中国论点以提高关注度。然而,中国还有一句俗谚叫作“乱世出英雄”,而这一点在深度学习当中表现得尤为典型。具体来讲,即使放眼全世界,中国亦堪称最为复杂的深度学习成长环境。
我刚刚结束为期十天的旅行,期间分别在北京、深圳、上海与杭州与众多深度学习初创企业会面,并就全球深度学习市场进行了一系列会谈。从本质层面来讲,中国在深度学习的技术、应用与启动方面皆不同于硅谷或者欧洲的思路,而此次访问本身亦让我真正通过众多深度学习初创企业的自我介绍了解到这片东方土地上的创业过程。除了让我对部分长期观点更具信心之外,此次旅程也在众多重要层面改变了我的固有看法。
在我看来,中国初创企业给人留下的最为深刻的印象,就是其与硅谷环境乃至其它亚洲市场的明显差异。
首先,来自工业赞助商以及美国半导体企业的经典风投资金相当可观——赛灵思以及英伟达等厂商都已经为高知名度中国初创企业注资,而且我认为未来还将有更多大型企业凭借自身资本进军这一领域。
第二,深度学习非常活跃,这一点符合目前美国本土出现的相关技术“淘金热”浪潮。
但与台湾、日本与韩国市场形成鲜明对比的是,这些地区的深度学习初创企业发展程度还不高(日本),或者对于深度学习技术的热情并不像中国大陆那么强烈(台湾与韩国)。而充足的资金与创业积极性则意味着,中国本土的初创企业拥有极为重要且正在快速发展的工程技术团队——根据我的见闻,规模最小的公司拥有 25 名员工,而最大的公司则拥有约 400 名员工。
事实上,中国初创企业的办公室布局已经与硅谷非常相似——存在大量不设隔间的开放式办公环境,且开始提供不间断零食与饮品。总而言之,在深度学习领域,中美两国开始以前所未有的方式实现了跨越太平洋的文化统一。
百度公司在深度学习领域砸下重金——其旗下拥有超过 1000 位成员的研究团队正是最好的证明。另外,中国各高校所发表的深度学习论文数量以及初创企业的关注度同样值得肯定。
总体而言,中国工业似乎开始逐渐将改革思维由“降低成本”转化为如何打造出更为成熟的产品,同时配合更合理的成本以优化整体材料清单,从而将功能创新作为核心竞争优势。再有,中国对于硬件及系统产品的高度关注在深度学习领域仍然有所表现:在中国,我发现纯云软件初创企业的数量要远低于美国或者英国的水平。然而,此类系统当中的原始软件内容正在迅速增长。
我访问过的几乎每家企业都拥有精妙且令人印象深刻的车辆追踪、面部识别、人群监控或者人口统计评估等演示案例。
在与众多软件公司的交流当中,我发现其中相当一部分都在构建或者规划芯片方案,旨在实现其构思当中的神经网络推理计算能力。目前约有四分之一的中国深度学习初创企业正在冲击芯片开发方向,然而全球 15 大芯片制造商当中只有 1 家拥有芯片定制服务。其中一家初创企业的执行长解释称,中国投资者倾向于以芯片为载体实现差异性竞争优势,而初创企业亦认为发展芯片业务有助于吸引更多资本。
这一点与硅谷的现有思维形成了鲜明对照——在硅谷,只要提到芯片业务,投资者往往会马上落荒而逃。这种显著的区别反映出中国芯片开发成本的持续下降(这主要是由于从业人员工资较低、尽可能避免使用 20 纳米及以下前沿级别制程工艺以及主要采取面向利基市场的小众设计等原因),以及将软件与芯片相绑定这一对软件价值加以保护的广泛共识。
颇具讽刺意味的是,硅谷初创企业目前很少选择开发自己的芯片——部分原因在于自主开发芯片会带来高昂的成本与极长产品上市时间,另一部分原因则在于云服务对于初创企业拥有更强大的投资吸引力,特别是考虑到其更为低廉的前期投入以及以周为单位的商机变化速度。
作为人机界面及监控领域的典型案例,汽车成为这波浪潮中的核心平台。全球最大的消费级无人机制造商大疆公司利用高复杂度深度学习技术进行目标追踪与手势控制。另外,大多数涉及视觉处理技术的公司都拿出了车辆、行人与自行车等对象的识别与追踪演示方案,旨在作为未来的汽车驾驶员辅助 / 自动驾驶车辆与监控技术基础。
目前在视觉处理领域身处优势地位的初创企业包括 Cambricon、DeepGlint、Deephi、Emotibot、Megvii、Horizon Robotics、Intellifusion、Minieye、Momenta、MorphX、Rokid、SenseTime 以及 Zero Zero Robotics 等等。音频系统同样受到高度关注,特别是包括嵌入式实时语音处理方案在内的自动语音识别类技术。在这一领域中的顶尖初创企业包括 AISpeech、Mobvoi 以及 Unisound 等。
中国已经成为全球最大的视频监控业务市场,甚至同时拥有最高的增长速度。中国相关产品供应商主要强调其对犯罪分子的识别与追踪能力,但实际上中国的常规犯罪问题并不严重(在暴力犯罪与财产犯罪比例方面远低于美国)。在一定程度上,“监控犯罪”所表达的实际上是监控政治动乱等影响执政稳定性的行为。当然,除此之外,利用面部识别功能实现访问控制与交易验证亦是视觉类应用方案的一大重要驱动力。
在为期十天的访问当中,我发现了以下特别值得关注的初创企业:
Horizon 公司是一家由余凯(Yu Kai)创建的深度学习企业。目前该公司拥有 220 名员工,且致力于在视觉处理系统相关领域进行广泛创新,具体包括智能家居、游戏、语音集成以及自动驾驶车辆。他们还采取严格的硬件 - 软件集成策略以实现更加完整且高效的解决方案。
官网:http://www.horizon.ai/
Intellifusion 公司是一家相当成熟的视频系统供应商,且在公共监控产品的部署领域与各政府机构保持着密切合作。他们目前利用 GPU 与 FPGA 部署自己的服务器,但亦有计划将更多功能纳入边缘设备当中(例如摄像头自身)。
官网:http://www.intellif.com/index.html
NextVPU 公司是我在本次访问当中见到的最为年轻(刚刚创立一年)且规模最小(仅拥有 24 名员工)的初创企业。他们正在努力打造 AR、机器人与 ADAS 系统。不过作为第一款产品,其专为视觉障碍人士开发的 AR 头戴设备在技术与社交支持层面皆极具吸引力。他们的这款头载设备能够通过全景分割机制提供步行导航功能,同时准确识别出数十种关键性对象——包括标志、障碍物与常见的家居及城市元素,从而帮助用户顺利完成日常行动。
官网:http://www.nextvpu.com/
Deephi 可谓此次深度学习初创企业探寻之旅当中技术水平最高且最令人印象深刻的公司之一,其与清华大学等中国知名技术高校以及多所美国学术研究型高校保持着密切联系。他们致力于利用世界领先的压缩技术将尖端神经网络映射至功率水平、计算能力以及内存资源皆相对有限的嵌入式设备当中,从而完成各类极度复杂的处理任务。他们通过一系列创新型可编程与优化推理架构以实现监控(视觉)及数据中心(视觉与语音)应用。
官网:
http://www.deephi.com/index.html#header
Sensetime 公司在视觉领域的深度学习应用范畴内堪称规模最大且最具知名度的软件初创企业之一。其拿出了令人印象深刻的演示方案,适用方向涵盖监控、面部识别、人口统计与情感分析、车辆街景识别与追踪等等。他们亦拥有充足的能力与自信以开发出有别于 Caffe、Tensor Flow 等其它标准化平台的自有训练框架——Parrots。
官网:http://www.sensetime.com/
Megvii 公司是一家极富盛名的中国“独角兽”企业——即市值超过 10 亿美元的初创公司,而其核心资产正是业界领先的 Face++ 应用。Face++ 是一套复杂且拥有广泛适应能力的面部识别环境,其直接与中国政府的面部数据库相对接。利用这套官方认证的数据库,其得以为阿里巴巴的支付宝与出行服务平台滴滴出行提供强大的客户身份验证支持。他们同样拿出了令人印象深刻的演示方案,适用于识别、增强现实与“增强摄影”等领域。与众多其它中国企业一样,Megvii 公司亦在尝试将功能由云端转移至嵌入式设备,旨在借此改善延迟水平、可用性与安全性。
官网:https://www.megvii.com/
Bitmain 公司很难被归类为初创企业,而且已经在非深度学习应用领域获得了巨大成功——特别是加密货币采矿硬件层面。他们已经成为散列计算领域规模最大的 ASIC 供应商(特别是在比特币采矿领域),而目前其亦将业务延伸至莱特币等其它币种当中。这家成立于 2013 年的公司在第二年获得了 100 美元营收,而今年其营收则爆增至 5 亿美元。如此可观的收入来源与盈利能力使其得以快速探索其它新兴领域,而深度学习平台似乎成为其未来业务扩张的理想方向。
官网:https://www.bitmain.com/
当然,作为一名外来人士,我的见闻不可能完全反映或者代表充满活力的中国深度学习初创社区中发生的一切。不过,我仍然乐于将自己的体验与大家分享,并将其整理为这份顶尖深度学习初创企业清单。也许有些朋友会对这份清单的涉猎深度感到惊讶,特别是考虑到其中一部分初创企业还没有最终确立自己的业务方向。然而从技术层面与市场探索趋势角度出发,中国创业社区确实在众多领域处于全球领先地位,因此值得大家给予高度关注。
这篇文章的扩展内容,包括我在中国所接触过的全部顶尖深度学习初创企业清单,如下表所示:
第四范式 | 成规模的深度学习云平台 |
思必驰 | 实时、基于云的自动语音识别,用于车载、智能家居和机器人 UI |
寒武纪科技 | AI 设备及神经网络处理器 |
格灵深瞳 | 3D 计算机视觉和深度学习,用于人和车辆监测、追踪及识别 |
深鉴科技 | 压缩 CNN 网络和处理器 |
竹间智能 | 基于多模态的人机自然交互界面 |
旷视科技 | 人脸识别 |
地平线机器人 | 智能家居,自动驾驶和公共安全 |
碳云智能 | 基于机器的个性化健康分析和健康指数预测 |
云天励飞 | 基于云的深度学习,用于公共安全和工业监测 |
Minieye | ADAS 摄像头和软件 |
出门问问 | 智能手表,使用云进行语音搜索 |
Momenta | L5 无人驾驶 AI 平台 |
摩图科技 | 商业化计算机视觉和深度学习技术,用于低成本、低功耗平台 |
Rokid | 家庭智能助理– 自动语音识别技术 + face/gesture |
中科视拓 | 赋能企业计算机视觉和机器学习的开源开发平台 |
商汤科技 | 计算机视觉 |
图普科技 | 图像识别技术和服务 |
图森科技 | 自动驾驶软件:检测和追踪,SLAM,图像分割、面部分析 |
云知声 | 基于 AI 的语音和文本识别 |
依图科技 | 用于安防、交通和医疗影像的计算机视觉 |
零零无限 | 智能无人机摄像头 |
关注 AI 前线公众账号(直接识别下图二维码),点击自动回复中的链接,按照提示进行就可以啦!还可以在公众号主页点击下方菜单“加入社群”获得入群方法~AI 前线,期待你的加入!
AI 时代,算法的重要性日渐凸显,对算法与数据结构的掌握程度,也是硅谷名企或者 BAT 等国内一线公司决定人才录用的关键指标。精通算法的技术人员,无论是职业发展还是薪酬等级,都将远远甩开身后那些只会一招半式的程序员。为此斯达克学员联合前 Facebook 早期工程师覃超,推出《算法与数据》系列课程,帮你打通算法与数据机构的任督二脉,在 AI 时代抢占先机。
欢迎扫描二维码联系小助手咨询课程详情,课程介绍请点击阅读原文。