记者| 杨丽
出品| AI科技大本营
若非要总结 2018、展望 2019 的话,可以借用云知声创始人兼 CEO 黄伟的一句点评:“所有伟大的公司都诞生于真实的生产需求。”
2019 年 1 月 2 日,云知声在京召开战略发布会,正式公布其正在研发的三款定位不同场景的 AI 芯片,包括第二代物联网语音芯片“雨燕”Lite、面向智慧城市的支持图像与语音的多模态芯片“海豚”、以及面向智慧出行的车载多模态芯片“雪豹”。据悉,该三款芯片计划于本年度 Q2、Q3、Q4 先后发布。
值得一提的是,发布会上,黄伟表示云知声的企业收入主要来自于 AI 芯片和软件,并预计 2019 年依然会有两至三倍的收入增长,且人均产值也十分良好。
从家居、车载、机器人等 AI+生活,到医疗、教育、政务、金融、客服、酒店等 AI+服务,从 2014 年确立“云端芯”的产品体系,到 2018 年首款物联网 AI 语音芯片 UniOne“雨燕”的发布,云知声将“场景”优势提升至了最优级。
几乎所有人还都沉浸在 2018 的寒冬里,云知声已抢先一步打响了新一年的战斗。那么,2019 年是否能真正成为人工智能实现量产化、规模化的一年呢?AI 芯片似乎成为了这个领域技术供应商无法绕过的话题。
黄伟表示,云知声不是一家以销售为主导的企业,销售人员占比仅 10% 不到。尽管云知声目前为多个行业的头部客户提供服务,但不会根据不同场景提供逐一定制服务。不过,不同的阶段,公司(战略)是不一样的。2019 年制定的增长目标将无疑促使云知声加大这些方面的投入。
会后,云知声 CEO 黄伟、IoT 事业部副总裁、芯片研发负责人李霄寒接受了 AI 科技大本营等媒体在内的采访。
“不设边界”的云知声
从 2014 年开始切入物联网 AI 硬件芯片方案(IVM),2015 年云知声正式组建芯片团队开始自研。随着三年后芯片的成功流片,2018 年 5 月云知声正式发布其第一代终端 AI 芯片“雨燕”,该芯片采用自主 AI 指令集,拥有具备完整自主知识产权的 DeepNet1.0、uDSP(数字信号处理器),并支持 DNN/LSTM/CNN 等多种深度神经网络模型。
随后几个月,云知声陆续开源 AI 芯片“雨燕”针对智能家居、智能音箱场景的语音交互解决方案。面向客户、方案商、开发者等上下游合作伙伴,提供具体场景的软硬一体化 Turnkey 解决方案,足够开放且高度可定制化。一家从软到硬的技术供应商,在外人看来难免像是一种“不设边界”。
“如果没有芯片就很难和算法结合起来,在这个做的过程中,我觉得边界是模糊的,随着技术的不断演进,场景的不断深入给我们提出了更多的需求。现阶段我们面向物联网选择了一个重点场景,将算力和应用服务更好的结合,这是比较明确的,”黄伟解释道。
直到如今,人工智能产业也未形成很大的市场,更没有任何一家企业能做到绝对的市场垄断。算法、框架、芯片、模组、加速器等领域都在时刻涌现新兴企业。云知声要做的则是针对 IoT 场景下的全栈式终端芯片,这也印证了其“云端芯”战略中“芯”的定位。
目前,基于“雨燕”芯片的全栈解决方案已导入的各类方案商及合作伙伴已超过 10 家,包括美的、奥克斯、海信、京东、360、中国平安、硬蛋科技等,相关产品最早将于今年 Q1 量产上市。
什么决定着终端芯片的设计?
通过摩尔定律我们知道:同一芯片所能提供的算力将越来越强;同理,不同芯片之间,单位算力输出的情况下,功耗则越来越低。这也是为什么从前段时间的英伟达 GPU 到现在的英特尔 Movidus 和国内的华为海思芯片都在进行从“云”到“端”的尝试。
黄伟说:“2G 时代看网络小说,3G 看图片,4G 诞生了快手、抖音、头条;5G 则是一场质变,有着广阔的覆盖、更宽的网络……云知声是 5G 的受益者。”
5G 与人工智能的结合将真正促进万物智联(AIoT)的落地与实现,端侧与中心侧需要更快速地响应和识别,以实现更复杂的功能。物联网设备数量的大规模增长、连接成本更为低廉、数据维度复杂多变、应用场景更为垂直等诸多挑战,将进一步挑战物联网 AI 芯片的设计。
除了成本、算力、功耗、安全性等需要考虑之外,在李霄寒看来,还需要关注以下三点:一是图像、语音等新维度的数据,对其传输的复杂度及数据实时性的需求;二是给定成本和功耗条件下,通用芯片架构达不到最佳能效比;三是基于深度学习加速的新硬件势在必行。
物联网 AI 芯片的最终呈现形式将不再是一个单一的硬件,而必然是承载着边缘能力与云端能力的多模态 AI 软硬一体解决方案。
因此,在芯片设计层面,他指出三点因素:
一是场景化,芯片设计正由原来追求的 PPA(Power、Performance、Area,即性能、功耗、面积)逐渐演变为基于软硬一体,甚至包括云端服务的方式来解决某个垂直场景;
二是多模态,芯片需要具备支持多模态数据采集分析和梳理的能力;
三是端云互动,即形成边缘算力和云端算力动态平衡。
多模态 AI 芯片技术布局
为实现多模态 AI 芯片的战略落地,除了语音技术,云知声在机器视觉方面也取得了不小进展。
其中,面向机器视觉的轻量级图像信号处理器已可实现在不依赖外部内存的情况下,在 30 fps 的速率下实时对传感器的图片进行预处理,以进一步提高后续机器视觉处理模块的处理速度和效果。借助基于人脸信息分析的多模态技术,已可实现人脸/物体识别、表情分析、标签化、唇动状态跟踪等功能,可为产品交互和用户体验提供更多的可玩性和灵活性。
尤为值得一提的是,云知声多模态人工智能核心 IP——DeepNet2.0 的发布,标志着云知声人工智能处理核心由 1.0 语音时代全面迈入 2.0 融合语音、图像等处理能力的多模态时代。DeepNet2.0 可兼容 LSTM/CNN/RNN/TDNN 等多种推理网络,支持可重构计算(计算单元可像七巧板一样进行任意拼接组合),支持 Winograd 处理,最高可配置算力达 4T。目前云知声 DeepNet2.0 已在 FPGA 上得到验证,将在 2019 年落地的全新多模态 AI 芯片“海豚”上落地。
此外,云知声还与杜克大学所领导的美国自然科学基金旗下唯一人工智能计算中心——ASIC 达成深度合作,致力于 AI 芯片算法压缩与量化技术, 以及非冯新型 AI 芯片计算架构研究。
(*本文由AI科技大本营原创,转载请联系微信1092722531)
公开课预告
◆
强化学习
◆
本课程是一次理论+实战的结合,将重点介绍强化学习的模型原理以及A3C模型原理,最后通过实践落实强化学习在游戏中的应用。
推荐阅读