依图“求索”芯片有多强?解读四大核心优势,还原造芯心法!

2019 年 5 月 9 日 智东西

看点:智能密度赶超英伟达,自动驾驶视觉处理性能媲美特斯拉FSD。

智东西5月9日报道,今天上午,依图科技在上海举办了一场相当不同于往的产品发布会。

这次依图发布的不是人脸识别,也不是语音识别,而是一款云端深度学习推理定制化SoC芯片——依图芯片questcore,中文名“求索”!

这款芯片从即日起正式商用,另外依图还展示了基于该芯片构建的软硬件一体化系列产品和行业解决方案。

今日,依图联合创始人兼CEO朱珑第一次出现在发布会现场,他提出”算法即芯片“的口号,并分享关于AI芯片的一些看法。

据介绍,这是全球首款深度学习云端定制SoC芯片,已经实现量产。搭载questcore的依图原子服务器,将为今年11月在上海举行的第二届世界进口博览会提供安保服务。

questcore的发布意味着,在人工智能(AI)赛道上,四大计算机视觉(CV)独角兽之一依图经过“视觉-语音-芯片”的三连跳,已然摇身一变,成为一家产品覆盖视觉到语音、从软件到硬件的全能型AI公司。


依图questcore芯片有哪些亮点?它的创新架构ManyCore又有哪些特性?这款芯片有获得哪些助力?依图有怎样的造芯优势?AI芯片发展的必然趋势是什么?……经过和依图内部人员进行深度沟通,智东西将为你揭晓一个更为清晰的依图questcore芯片版图。

全球首款深度学习云端定制SoC芯片

依图推出其首款自研芯片questcore,中文名叫“求索”,是依图追求“极智”的体现,由依图科技和AI芯片初创团队ThinkForce联合开发。

这款深度学习云端定制SoC芯片从设计到制造实现全面国产化,拥有自主知识产权的ManyCore架构,基于领域专用架构(Domain Specific Architecture,DSA)理念,专为计算机视觉应用而生,针对视觉领域的不同运算进行加速,适用于人脸识别、车辆检测、视频结构化分析、行人再识别等多种视觉推理任务。

目前questcore芯片会用在在依图的云端和边缘服务器上,与依图的智能视觉分析软件结合,作为软硬件一体化的解决方案对外销售。

在本次发布会上,依图联合创始人兼CEO朱珑介绍了依图芯片的四大设计理念:高密度、世界级AI算法、64路视频分析、服务器AI芯片。

朱珑表示,questcore芯片不是一个AI加速模块,而是一个完整具有端到端能力的AI处理器。

作为云端服务器芯片,它可以独立运行,不依赖Intel x86 CPU。虽说是为了服务器芯片而生,questcore既支持云端,也支持边缘。

questcore芯片的规格参数如下:


据介绍,在实际的云端应用场景,依图questcore最高能提供每秒15 TOPS的视觉推理性能,最大功耗仅20W,比一个普通的电灯泡还小。

在同等功耗下,questcore的视觉推理性能是市面现有主流同类产品的2~5倍,其安防摄像头单路功耗仅为英伟达GPU P4的30%

朱珑表示,依图开发这款芯片,不是想追求英伟达那样几百个T的算力,而是看重高计算密度。


questcore芯片集成度高,能高效适配各类深度学习算法,模型兼容性好,可扩展性高,支持TensorFlow、PyTorch等各类深度学习框架,无缝接入现有生态。

它还自带网络支持模块,支持虚拟化、容器化,将AI云的弹性计算和调度提升一个量级。

该芯片适用于加速各类视觉推理任务,比如交通运输、公共安全、智慧医疗和智慧零售等行业,尤其是对云端智能视频实时分析等应用具有强需求的企业环境。

在现场,朱珑还特意提到近期发布的特斯拉全自动驾驶(FSD)芯片。他表示,依图芯片与特斯拉芯片异曲同工,特斯拉从3年前开始打造,而依图只用了2年。


朱珑说,依图不会自己做自动驾驶,但欢迎无人车公司来合作。

发布原子系列云端服务器和边缘盒子

除了推出芯片,依图还发布了基于questcore芯片的依图原子系列云端服务器和面向边缘的依图前沿系列边缘盒子。

依图科技首席创新官吕昊还在现场做了插电演示,手持由一台体积与15 英寸苹果MacBook Pro笔记本相当的依图原子服务器,该服务器由4个questcore芯片组成。

依图用200路摄像头现场采集观众们的人脸,并成功进行实时人脸识别比对。

吕昊展示了服务器的内部结构,这款服务器远比常规的服务器机箱更轻薄,一只手就能举起。

依图原子服务器基于questcore打造,一台服务器提供的算力与8张英伟达P4卡服务器相当,而体积仅为后者的一半,功耗不到20%


吕昊表示,一个约要2000美元的NVIDIA P4显卡仅能支持27路摄像头,而依图的服务器能带动200路实时解码和视频解析,功耗不超过250W。

在进行视频解析时,1台依图原子服务器(搭载4核questcore芯片,除此之外无需其他配置),与8卡英伟达T4服务器(含双核英特尔x86 CPU)对比,单路视频解析功耗仅为后者的 20%,与8卡英伟达P4 服务器(同样含双核英特尔x86 CPU)相比,功耗约为后者的10%。

吕昊称,questcore芯片基本可以完成所有视觉解析,可以做肺癌诊断、儿童骨龄预测以及非常多智慧城市应用,未来有望成为担当起非常多视觉任务的视觉中枢。

据介绍,依图questcore构建的视频解析系统,将原本需要16 台机柜的方案压缩到1 台,使整体建设费用投入减少 50%,运维成本降低 80%

此外,依图原子服务器能够直接在云端升级系统,不需要大规模购买或者更新已有的摄像头、传感器等终端设备,大幅提高了现有基础设施的利用率。

朱珑表示,未来希望questcore芯片可以让一万路智能视频解析成为标配。

questcore最大特点:灵活可扩展,兼顾云与边

questcore采用自研芯片架构,除了针对机器视觉推理运算加速,其最大特点之一就是灵活可扩展,在设计时充分考虑到了不同应用场景,能够兼顾云端和边缘的视觉推理计算需求。

1、可作为服务器芯片,也可独立运行

SoC即System-on-Chip,中文叫“片上系统”,一般指将多个IP集成在同一个芯片上。

questcore采用定制化SoC解决方案,客户可以根据不同的使用需求,选择不同的配置,使得客户能按需定制,在性能、成本、功耗、可靠性以及生命周期与适用范围等方面都有明显的优势。

依图认为,这是集成电路设计发展的必然趋势。

此外,SoC在性能、成本、功耗、可靠性以及生命周期与适用范围等方面都有明显的优势,是集成电路设计发展的必然趋势。

与NVIDIA GPU、Google TPU和其他AI芯片公司研发的AI加速器产品相比,依图芯片一大不同之处在于,它作为服务器芯片可以独立运行,不依赖Intel x86 CPU。

2、自研芯片架构,算法团队深度参与造芯

如今摩尔定律濒临物理极限,但算法性能仍在万倍增长。过去4年,依图的人脸识别算法精度提升了10万倍。在这样的背景下,AI正推动计算产业迈入“算法即芯片”时代。

现有的计算机架构已经无法满足AI对算力不断增长的需求,领域专用架构(DSA)正成为未来计算的主流,一个开创性的例子就是针对深度神经网络(DNN)进行加速的谷歌TPU。

因此,依图以AI为中心去思考计算,思考计算机架构。

依图认为,在算法即芯片的时代,好的算法才能更高效地利用芯片架构,或者说指导芯片架构设计,同时把算力更高效地转化为智能。

questcore基于领域专用架构(DSA,Domain Specific Architecture)理念,针对应用领域做优化处理。

对于DSA芯片而言,AI领域知识(Domain Knowledge)的理解是最重要的,包括算法发展趋势、实际应用场景和具体业务逻辑的洞察。

而依图长期在视觉领域的耕耘,使其对机器视觉技术和行业有着深刻理解,从而为它打造更好的视觉AI芯片奠定基石。

依图算法团队从一开始就深度参与了芯片的设计,通过自研架构,能够在保持极低功耗的情况下,最大限度提高计算力,充分发挥依图全球领先的智能算法性能。

ManyCore架构高效适配各类深度学习算法,模型兼容性好,支持TensorFlow、PyTorch、Caffe等各类深度学习框架,便于无缝接入现有生态。

据依图介绍,该架构的最大优势是可扩展性强,在设计时同时考虑到了云端和边缘深度学习推理计算的需求,能够根据实际应用场景动态扩容。

3、仅针对INT 8数据加速,实现出色性能和功耗比的关键

依图告诉智东西,考虑目前以及将来一定时间内业界对视觉分析应用的需求,这是目前性价比最高的方案。

结合依图在视觉领域的长期实践与研究,依图自研了芯片架构,仅针对INT 8数据(8 位整数数据类型)进行加速,这也是questcore实现性能和功耗比呈量级提升的根本原因之一。

此前高通曾表示,到2025年,数据中心推理加速器市场可能达到170亿美元。与AI训练不同,AI推理并不需要很高的精度,INT 8甚至INT 4的低精度数据类型就足以满足当前绝大多数的云端智能视频分析/视觉推理计算需求。

但是,市面上针对这一需求或者低精度数据类型推理进行加速的AI芯片选择还较少。

4、软硬件结合,灵活适配基础设施

依图芯片将与依图智能软件结合在一起,构成软硬件一体化的产品或解决方案对外销售,灵活配适客户现有的软硬件基础设施。

之所以强调软硬件一体化,依图表示,这是因为市场上并不存在单独能使用的软件或者硬件,整个行业、整个生态一定是紧密结合在一起的;产品和解决方案推出以后,也仅仅只是开始,后续的运营和维护等客户服务,也是考量产品是否能取得成功的关键因素。

如今依图推出questcore芯片,既具有灵活可扩展的架构,又可单独使用,不依赖不英特尔x86 CPU,使得基于questcore构建的产品和解决方案兼顾云端和边缘计算的需求。

接下来,依图将继续投入原创先进的AI软件和硬件技术研发,力求为客户和市场带来更好的软硬件一体化的产品和行业解决方案。

依图的造芯逻辑:不是为了做芯片而做芯片

依图是我国四大CV独角兽之一,以世界领先的AI技术著称,上一轮估值已达150亿元。

如在美国国家标准与技术研究院(NIST)举行的全球人脸识别权威测试(FRVT)中,依图连续三年获得第一名。

依图联合创始人兼CEO朱珑认为AI普及的关键是智能密度,机器的智能要便宜,便宜的本质是密度,分两个维度来讲:

第一个是宏观上,要从单体的智能到机器智能到群体的智能,如让单个识别人脸的摄像头发展到一万个,而且这一万个摄像头识别出来的世界是能够交流的、可决策的。

第二个是在微观上,单个计算机能够支撑刚才所的智慧的创意要足够的,这里我讲的是智慧算力,而不是简单的机器的算力。


在AI算法领域势如破竹的依图,为什么要走出自己的舒适区,而选择自研AI芯片这条并不好走的路呢?

依图坚信,在没有先例可循的智能时代,中国AI创企与世界科技巨头站在同一起跑线上,完全有机会成为新时代的巨头。

秉持这样的信念,依图在推进智能项目落地的过程中,深切感受到针对应用场景和业务逻辑定制AI芯片的必要性和迫切性,并预见软硬件一体化是AI技术落地的必然发展方向。

依图向智东西透露,其自研芯片的主要原因并非为了芯片的商业化,而是从场景出发,更好地发挥依图算法和软件的性能,为客户提供针对特定场景优化的性能、功耗和成本最优的一体化解决方案。

这一点与谷歌、微软、阿里等公司的自研芯片逻辑异曲同工。

在现有计算机架构无法满足AI对算力的需求,摩尔定律濒临终点,而算法性能还在火箭式提升的大背景下,依图早早意识到应以AI为中心来思考计算机体系结构。

他们坚信,在新的这一轮体系结构革命中,算法和芯片两者紧密耦合,不可分离,只有懂算法的AI公司才能做出更好的AI芯片,才能将算力更高效地转化为智能。

任何一个新技术要实现大规模推广,基本前提是将价格/成本降低到绝大多数人都能用的起范围,只有这样产品才能真正普及。

依图希望通过研发AI芯片,能够推动AI技术的真正落地和大范围铺开。

造芯一年半,揭秘背后的功臣

依图的造芯计划在2017年末就初步浮出水面。

去年12月,依图正式对外宣布战略投资AI芯片初创团队熠知电子ThinkForce。正如公开资料显示的那样,依图是ThinkForce的股东,也是合作伙伴。

ThinkForce是中国少有的拥有芯片研发全链路能力的团队,核心成员来自 IBM、AMD、Intel、LSI、Broadcom、Cadence、ZTE 等芯片业界龙头企业,全都拥有十年以上的芯片行业从业经历,分别在芯片设计、体系结构、算法研究等领域有深厚造诣,经手过40余款不同芯片的量产,总销售额高达数十亿美元。

ThinkForce的AI芯片具备创新的异构运算架构、完整的功能模块和先进的半导体制程工艺,可以在更短的时间内,用更低的功耗完成更大量的深度神经网络矩阵运算。

为构建友好的开发环境和健康的产业生态,ThinkForce还准备了易用的软件工具,方便用户完成算法的硬件部署。

依图算法团队与ThinkForce硬件团队从一开始就紧密配合,研发出的questcore芯片能够极大程度地发挥依图在算法和软件层面的积累。

结语:软硬件一体化成AI落地必然方向

questcore芯片的问世,不仅展现了依图从软件到硬件的垂直整合能力,也为国产化数据中心服务器AI芯片增加了一种市场选择。

随着questcore芯片量产,依图已成为当下技术布局最为全面的AI创企,产品阵列覆盖计算机视觉、自然语言处理、语音识别和AI芯片,并在这些领域均保持世界领先的技术优势。

从依图造芯的选择来看,在摩尔定律逼近瓶颈、通用芯片难以满足所有需求的大环境下,针对应用场景和业务需求定制AI芯片正成为新的潮流,如谷歌TPU、百度昆仑等都选择了这样的道路。

与此同时,算法与芯片的关系更加紧密,软硬件一体化正成为AI落地的必然方向,在强手如云、巨头林立的AI芯片战场中,如果一家公司既拥有扎实的AI算法功底,又具备出色的软硬件垂直整合能力,还能根据自身优势和应用需求量体裁衣,将算力更经济高效地转化为智能,那么无疑将对其提高产品竞争力和技术壁垒大有裨益。

本账号系网易新闻·网易号“各有态度”签约帐号

智东西公开课直播预告

5月16日晚7点,GTI北京中心技术总监梁进将主讲AI芯片应用系列课第十讲,主题为《存算一体AI芯片如何加速图像处理》。扫码进入直播间,开启「开课提醒」,以防错过!



登录查看更多
0

相关内容

斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
29+阅读 · 2020年3月5日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
300+阅读 · 2019年12月23日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
CBInsights公布32家AI独角兽名单:中国10家美国17家
1号机器人网
5+阅读 · 2019年2月18日
人工智能产业链,是时候梳理一下了!
物联网智库
3+阅读 · 2018年1月19日
2017人工智能创新公司50强出炉 旷视(Face++)上榜
Megvii旷视科技
3+阅读 · 2017年7月10日
深度解读 | 为何众科技巨头都在抢滩语音识别技术?
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Arxiv
7+阅读 · 2018年11月27日
VIP会员
相关VIP内容
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
29+阅读 · 2020年3月5日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
300+阅读 · 2019年12月23日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
Top
微信扫码咨询专知VIP会员