中国深度学习初创企业观察:视觉技术受集体欢迎,监控应用成最大热门

2017 年 7 月 20 日 AI前线 Chris Rowen
作者|Chris Rowen
编辑|运和凭
2016 年,人工智能技术全球性爆发,国内外不论大厂小厂,纷纷开始转向人工智能的研究。时至今日,中国的 AI 初创公司都发展如何了?IEEE院士、Cognite Venture 的 CEO:Chris Rowen来中国进行了为期十天的旅行,与中国的部分初创公司已经有了些许接触,正逢 AI 发展之“乱世”,中国 AI 的“乱世英雄们”在这位外来人士眼中,表现如何呢?

可能很多朋友都听说过一句俗谚,即“宁为太平狗,不为乱世人”。然而,事实证明中国人对这样的处世哲学并不完全认同——英国正常有奥斯汀 - 张伯伦(Austin Chamberlain)在上世纪三十年代提出了这一英文表述(May you live in interesting times),并称其为中国论点以提高关注度。然而,中国还有一句俗谚叫作“乱世出英雄”,而这一点在深度学习当中表现得尤为典型。具体来讲,即使放眼全世界,中国亦堪称最为复杂的深度学习成长环境。

我刚刚结束为期十天的旅行,期间分别在北京、深圳、上海与杭州与众多深度学习初创企业会面,并就全球深度学习市场进行了一系列会谈。从本质层面来讲,中国在深度学习的技术、应用与启动方面皆不同于硅谷或者欧洲的思路,而此次访问本身亦让我真正通过众多深度学习初创企业的自我介绍了解到这片东方土地上的创业过程。除了让我对部分长期观点更具信心之外,此次旅程也在众多重要层面改变了我的固有看法。

在我看来,中国初创企业给人留下的最为深刻的印象,就是其与硅谷环境乃至其它亚洲市场的明显差异。

首先,来自工业赞助商以及美国半导体企业的经典风投资金相当可观——赛灵思以及英伟达等厂商都已经为高知名度中国初创企业注资,而且我认为未来还将有更多大型企业凭借自身资本进军这一领域。

第二,深度学习非常活跃,这一点符合目前美国本土出现的相关技术“淘金热”浪潮。

但与台湾、日本与韩国市场形成鲜明对比的是,这些地区的深度学习初创企业发展程度还不高(日本),或者对于深度学习技术的热情并不像中国大陆那么强烈(台湾与韩国)。而充足的资金与创业积极性则意味着,中国本土的初创企业拥有极为重要且正在快速发展的工程技术团队——根据我的见闻,规模最小的公司拥有 25 名员工,而最大的公司则拥有约 400 名员工。

事实上,中国初创企业的办公室布局已经与硅谷非常相似——存在大量不设隔间的开放式办公环境,且开始提供不间断零食与饮品。总而言之,在深度学习领域,中美两国开始以前所未有的方式实现了跨越太平洋的文化统一

观察与结论
一、中国学术界与工业技术界正在密切关注深度学习技术的爆炸式发展,且相当一部分企业正在努力将其引入自身产品。

百度公司在深度学习领域砸下重金——其旗下拥有超过 1000 位成员的研究团队正是最好的证明。另外,中国各高校所发表的深度学习论文数量以及初创企业的关注度同样值得肯定。

总体而言,中国工业似乎开始逐渐将改革思维由“降低成本”转化为如何打造出更为成熟的产品,同时配合更合理的成本以优化整体材料清单,从而将功能创新作为核心竞争优势。再有,中国对于硬件及系统产品的高度关注在深度学习领域仍然有所表现:在中国,我发现纯云软件初创企业的数量要远低于美国或者英国的水平。然而,此类系统当中的原始软件内容正在迅速增长。

我访问过的几乎每家企业都拥有精妙且令人印象深刻的车辆追踪、面部识别、人群监控或者人口统计评估等演示案例。

二、中国初创企业不惧开发新型深度学习芯片平台。

在与众多软件公司的交流当中,我发现其中相当一部分都在构建或者规划芯片方案,旨在实现其构思当中的神经网络推理计算能力。目前约有四分之一的中国深度学习初创企业正在冲击芯片开发方向,然而全球 15 大芯片制造商当中只有 1 家拥有芯片定制服务。其中一家初创企业的执行长解释称,中国投资者倾向于以芯片为载体实现差异性竞争优势,而初创企业亦认为发展芯片业务有助于吸引更多资本。

这一点与硅谷的现有思维形成了鲜明对照——在硅谷,只要提到芯片业务,投资者往往会马上落荒而逃。这种显著的区别反映出中国芯片开发成本的持续下降(这主要是由于从业人员工资较低、尽可能避免使用 20 纳米及以下前沿级别制程工艺以及主要采取面向利基市场的小众设计等原因),以及将软件与芯片相绑定这一对软件价值加以保护的广泛共识。

颇具讽刺意味的是,硅谷初创企业目前很少选择开发自己的芯片——部分原因在于自主开发芯片会带来高昂的成本与极长产品上市时间,另一部分原因则在于云服务对于初创企业拥有更强大的投资吸引力,特别是考虑到其更为低廉的前期投入以及以周为单位的商机变化速度。

三、中国初创企业几乎全部专注于实时视觉与音频应用,且仅支持基于云的角色部署机制。

作为人机界面及监控领域的典型案例,汽车成为这波浪潮中的核心平台。全球最大的消费级无人机制造商大疆公司利用高复杂度深度学习技术进行目标追踪与手势控制。另外,大多数涉及视觉处理技术的公司都拿出了车辆、行人与自行车等对象的识别与追踪演示方案,旨在作为未来的汽车驾驶员辅助 / 自动驾驶车辆与监控技术基础。

目前在视觉处理领域身处优势地位的初创企业包括 Cambricon、DeepGlint、Deephi、Emotibot、Megvii、Horizon Robotics、Intellifusion、Minieye、Momenta、MorphX、Rokid、SenseTime 以及 Zero Zero Robotics 等等。音频系统同样受到高度关注,特别是包括嵌入式实时语音处理方案在内的自动语音识别类技术。在这一领域中的顶尖初创企业包括 AISpeech、Mobvoi 以及 Unisound 等。

四、 中国的监控业务市场拥有不成比例的庞大规模,这反映出中国对基于深度学习技术的面部识别、行人追踪以及人群监测类应用的旺盛需求。

中国已经成为全球最大的视频监控业务市场,甚至同时拥有最高的增长速度。中国相关产品供应商主要强调其对犯罪分子的识别与追踪能力,但实际上中国的常规犯罪问题并不严重(在暴力犯罪与财产犯罪比例方面远低于美国)。在一定程度上,“监控犯罪”所表达的实际上是监控政治动乱等影响执政稳定性的行为。当然,除此之外,利用面部识别功能实现访问控制与交易验证亦是视觉类应用方案的一大重要驱动力。

在为期十天的访问当中,我发现了以下特别值得关注的初创企业:

Horizon Robotics(地平线机器人) [北京]

Horizon 公司是一家由余凯(Yu Kai)创建的深度学习企业。目前该公司拥有 220 名员工,且致力于在视觉处理系统相关领域进行广泛创新,具体包括智能家居、游戏、语音集成以及自动驾驶车辆。他们还采取严格的硬件 - 软件集成策略以实现更加完整且高效的解决方案。

官网:http://www.horizon.ai/

Intellifusion (云天励飞)[深圳]

Intellifusion 公司是一家相当成熟的视频系统供应商,且在公共监控产品的部署领域与各政府机构保持着密切合作。他们目前利用 GPU 与 FPGA 部署自己的服务器,但亦有计划将更多功能纳入边缘设备当中(例如摄像头自身)。

官网:http://www.intellif.com/index.html

NextVPU (肇观电子)[上海]:

NextVPU 公司是我在本次访问当中见到的最为年轻(刚刚创立一年)且规模最小(仅拥有 24 名员工)的初创企业。他们正在努力打造 AR、机器人与 ADAS 系统。不过作为第一款产品,其专为视觉障碍人士开发的 AR 头戴设备在技术与社交支持层面皆极具吸引力。他们的这款头载设备能够通过全景分割机制提供步行导航功能,同时准确识别出数十种关键性对象——包括标志、障碍物与常见的家居及城市元素,从而帮助用户顺利完成日常行动。

官网:http://www.nextvpu.com/

Deephi (深鉴科技)[北京]

Deephi 可谓此次深度学习初创企业探寻之旅当中技术水平最高且最令人印象深刻的公司之一,其与清华大学等中国知名技术高校以及多所美国学术研究型高校保持着密切联系。他们致力于利用世界领先的压缩技术将尖端神经网络映射至功率水平、计算能力以及内存资源皆相对有限的嵌入式设备当中,从而完成各类极度复杂的处理任务。他们通过一系列创新型可编程与优化推理架构以实现监控(视觉)及数据中心(视觉与语音)应用。

官网:

http://www.deephi.com/index.html#header

Sensetime (商汤科技)[北京]

Sensetime 公司在视觉领域的深度学习应用范畴内堪称规模最大且最具知名度的软件初创企业之一。其拿出了令人印象深刻的演示方案,适用方向涵盖监控、面部识别、人口统计与情感分析、车辆街景识别与追踪等等。他们亦拥有充足的能力与自信以开发出有别于 Caffe、Tensor Flow 等其它标准化平台的自有训练框架——Parrots。

官网:http://www.sensetime.com/

Megvii (旷视科技)[北京]:

Megvii 公司是一家极富盛名的中国“独角兽”企业——即市值超过 10 亿美元的初创公司,而其核心资产正是业界领先的 Face++ 应用。Face++ 是一套复杂且拥有广泛适应能力的面部识别环境,其直接与中国政府的面部数据库相对接。利用这套官方认证的数据库,其得以为阿里巴巴的支付宝与出行服务平台滴滴出行提供强大的客户身份验证支持。他们同样拿出了令人印象深刻的演示方案,适用于识别、增强现实与“增强摄影”等领域。与众多其它中国企业一样,Megvii 公司亦在尝试将功能由云端转移至嵌入式设备,旨在借此改善延迟水平、可用性与安全性。

官网:https://www.megvii.com/

Bitmain (比特大陆)[北京]

Bitmain 公司很难被归类为初创企业,而且已经在非深度学习应用领域获得了巨大成功——特别是加密货币采矿硬件层面。他们已经成为散列计算领域规模最大的 ASIC 供应商(特别是在比特币采矿领域),而目前其亦将业务延伸至莱特币等其它币种当中。这家成立于 2013 年的公司在第二年获得了 100 美元营收,而今年其营收则爆增至 5 亿美元。如此可观的收入来源与盈利能力使其得以快速探索其它新兴领域,而深度学习平台似乎成为其未来业务扩张的理想方向。

官网:https://www.bitmain.com/

当然,作为一名外来人士,我的见闻不可能完全反映或者代表充满活力的中国深度学习初创社区中发生的一切。不过,我仍然乐于将自己的体验与大家分享,并将其整理为这份顶尖深度学习初创企业清单。也许有些朋友会对这份清单的涉猎深度感到惊讶,特别是考虑到其中一部分初创企业还没有最终确立自己的业务方向。然而从技术层面与市场探索趋势角度出发,中国创业社区确实在众多领域处于全球领先地位,因此值得大家给予高度关注。

这篇文章的扩展内容,包括我在中国所接触过的全部顶尖深度学习初创企业清单,如下表所示:


第四范式 成规模的深度学习云平台
思必驰 实时、基于云的自动语音识别,用于车载、智能家居和机器人 UI
寒武纪科技 AI 设备及神经网络处理器
格灵深瞳 3D 计算机视觉和深度学习,用于人和车辆监测、追踪及识别
深鉴科技 压缩 CNN 网络和处理器
竹间智能 基于多模态的人机自然交互界面
旷视科技 人脸识别
地平线机器人 智能家居,自动驾驶和公共安全
碳云智能 基于机器的个性化健康分析和健康指数预测
云天励飞 基于云的深度学习,用于公共安全和工业监测
Minieye ADAS 摄像头和软件
出门问问 智能手表,使用云进行语音搜索
Momenta L5 无人驾驶 AI 平台
摩图科技 商业化计算机视觉和深度学习技术,用于低成本、低功耗平台
Rokid 家庭智能助理– 自动语音识别技术 + face/gesture
中科视拓 赋能企业计算机视觉和机器学习的开源开发平台
商汤科技 计算机视觉
图普科技 图像识别技术和服务
图森科技 自动驾驶软件:检测和追踪,SLAM,图像分割、面部分析
云知声 基于 AI 的语音和文本识别
依图科技 用于安防、交通和医疗影像的计算机视觉
零零无限 智能无人机摄像头


AI 前线微信社群
入群方法

关注 AI 前线公众账号(直接识别下图二维码),点击自动回复中的链接,按照提示进行就可以啦!还可以在公众号主页点击下方菜单“加入社群”获得入群方法~AI 前线,期待你的加入!



活动通知

AI 时代,算法的重要性日渐凸显,对算法与数据结构的掌握程度,也是硅谷名企或者 BAT 等国内一线公司决定人才录用的关键指标。精通算法的技术人员,无论是职业发展还是薪酬等级,都将远远甩开身后那些只会一招半式的程序员。为此斯达克学员联合前 Facebook 早期工程师覃超,推出《算法与数据》系列课程,帮你打通算法与数据机构的任督二脉,在 AI 时代抢占先机。

欢迎扫描二维码联系小助手咨询课程详情,课程介绍请点击阅读原文。


登录查看更多
0

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
234+阅读 · 2020年4月18日
【中科院自动化所】视觉对抗样本生成技术概述
专知会员服务
35+阅读 · 2020年4月15日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
295+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
91+阅读 · 2019年11月13日
人工智能视觉丨被消费者忽视的工业领域应用
乌镇智库
5+阅读 · 2019年11月22日
1年融资超230亿!计算机视觉为何如此吸金?
对比激光SLAM与视觉SLAM:谁会成为未来主流趋势?
人工智能学家
8+阅读 · 2018年11月13日
深度|拥抱人工智能报告:中国未来就业的挑战与应对
机器人大讲堂
5+阅读 · 2018年9月24日
无人再谈CV:计算机视觉公司的困境
镁客网
7+阅读 · 2018年7月7日
创业者和伪创业者的10大区别
创业财经汇
8+阅读 · 2018年6月5日
2018-2020年中国服务机器人行业深度研究报告
机器人大讲堂
5+阅读 · 2018年1月30日
2017年计算机视觉创业投资现状及未来趋势
计算机视觉life
3+阅读 · 2018年1月25日
2017人工智能创新公司50强出炉 旷视(Face++)上榜
Megvii旷视科技
3+阅读 · 2017年7月10日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Transfer Adaptation Learning: A Decade Survey
Arxiv
37+阅读 · 2019年3月12日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
4+阅读 · 2018年7月4日
Arxiv
3+阅读 · 2018年3月29日
VIP会员
相关资讯
人工智能视觉丨被消费者忽视的工业领域应用
乌镇智库
5+阅读 · 2019年11月22日
1年融资超230亿!计算机视觉为何如此吸金?
对比激光SLAM与视觉SLAM:谁会成为未来主流趋势?
人工智能学家
8+阅读 · 2018年11月13日
深度|拥抱人工智能报告:中国未来就业的挑战与应对
机器人大讲堂
5+阅读 · 2018年9月24日
无人再谈CV:计算机视觉公司的困境
镁客网
7+阅读 · 2018年7月7日
创业者和伪创业者的10大区别
创业财经汇
8+阅读 · 2018年6月5日
2018-2020年中国服务机器人行业深度研究报告
机器人大讲堂
5+阅读 · 2018年1月30日
2017年计算机视觉创业投资现状及未来趋势
计算机视觉life
3+阅读 · 2018年1月25日
2017人工智能创新公司50强出炉 旷视(Face++)上榜
Megvii旷视科技
3+阅读 · 2017年7月10日
相关论文
Top
微信扫码咨询专知VIP会员