寒武纪科技发布首款云端AI芯片,陈天石:这是征程新起点

2018 年 5 月 4 日 黑智 黑君



5月3日,智能芯片设计公司寒武纪科技于上海发布了Cambricon MLU100云端智能芯片和板卡产品、寒武纪1M终端智能处理器IP产品。联想、曙光和科大讯飞作为寒武纪的合作伙伴同时发布了基于寒武纪芯片的应用产品。


发布会上,中国科学技术大学教授陈国良院士、中国科学院科学传播局局长周德进、中国科学院计算技术研究所党委书记李锦涛、中国科学院上海分院副院长张旭院士、上海市经济和信息化委员会总工程师张英、上海市临港地区开发建设管理委员会党组书记陈杰等嘉宾出席,以及国内外的人工智能和集成电路业界的知名企业代表也参加了本次发布会。


寒武纪“由端入云”


在发布会上,寒武纪公司创始人兼CEO陈天石博士发表了主旨演讲。陈天石回顾了寒武纪创业的初衷,并介绍了寒武纪的商业理念是“开放、协作、共赢”:与全球上下游的合作伙伴紧密合作,为人类迈向智能时代构建核心物质载体。


演讲中,陈天石正式对外发布了寒武纪的两款全新产品:终端智能处理器IP产品寒武纪1M、云端智能芯片Cambricon MLU100及其板卡。


寒武纪在2016年推出的第一代终端智能处理器IP产品寒武纪1A是全球第一款商用终端智能处理器IP产品,已经应用于千万级智能终端中(包括华为Mate10、P20和荣耀10等手机)。这次最新发布的寒武纪1M是公司的第三代IP产品,在TSMC 7nm工艺下8位运算的效能比达5Tops/watt (每瓦5万亿次运算),提供三种规模的处理器核(2Tops/4Tops/8Tops)以满足不同应用场景下不同量级的智能处理需求,并可通过多核互联进一步提高性能。寒武纪1M处理器延续了寒武纪前两代IP产品(寒武纪1H/1A)的完备性,单个处理器核即可支持CNN、RNN、SOM等多样化的深度学习模型,并更进一步支持SVM、k-NN、k-Means、决策树等经典机器学习算法,支持本地训练,为视觉、语音、自然语言处理以及各类经典的机器学习任务提供了灵活高效的计算平台,可广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域当中。


这场发布会的焦点是首次正式亮相的Cambricon MLU100云端智能芯片。MLU100采用寒武纪最新的MLUv01架构和TSMC 16nm的先进工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。与寒武纪系列终端处理器一样,MLU100云端芯片仍然延续了寒武纪产品一贯出色的通用性,可支持各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。MLU100的板卡使用PCIe接口,其外形设计灵感来自于寒武纪地质时代的远古海洋生物三叶虫,以黑色、蓝色为主色调,简洁而富有科技感。


寒武纪终端和云端产品均原生支持寒武纪NeuWare软件工具链,可以方便地进行智能应用的开发,迁移和调优。陈天石表示,寒武纪创立的初衷就是要让全世界都能用上智能处理器。寒武纪将秉承学术界开放、协作的精神,以处理器IP授权的形式与全世界同行共享寒武纪最新的技术成果,使全球客户能够快速设计和生产具备人工智能处理能力的芯片产品;寒武纪在技术上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不仅可独立完成各种复杂的云端智能任务,更可以与寒武纪1A/1H/1M系列终端处理器完美适配,让终端和云端在统一的智能生态基础上协同完成复杂的智能处理任务。


“寒武纪生态”爆发


在陈天石的演讲之后,寒武纪的部分产业伙伴公开展示了基于寒武纪芯片的应用方案。联想集团于今日的发布会上推出了基于Cambricon MLU100智能处理卡的ThinkSystem SR650,打破了37项服务器基准测试的世界记录。该产品为2U2路机架式规格,支持2个MLU100智能处理卡。这款云端智能服务器的面世将全面支撑起联想客户在机器学习/VDI/虚拟化/云/数据库/分析/SAP等方向上的业务需求。


中科曙光也在今日的发布会上同步推出了基于Cambricon MLU100智能处理卡的服务器产品系列“PHANERON”。PHANERON系列于2017年11月面世,基于寒武纪此前公布的一款原型测试芯片。而此次发布的“PHANERON”新品跟随MLU100智能加速卡的发布进行了同步升级,性能更为强劲,可以支持2-10块寒武纪MLU处理卡,灵活应对不同的智能应用负载。以升级版的PHANERON-10为例,单台服务器可集成10片寒武纪人工智能处理单元,可以为人工智能训练应用提供832T半精度浮点运算能力,为推理应用提供1.66P整数运算能力,典型场景下的能效提升30倍以上。此外,中科曙光还披露了人工智能管理平台SothisAI,可以与寒武纪的芯片及其开发环境实现无缝对接、深度融合。


智能语音应用的领头羊科大讯飞公司也在今日的发布会上披露了与寒武纪芯片的深度合作研发项目。根据介绍,一小时的语音数据在一个传统处理器上进行智能应用处理,需要一万小时才能完成,因此科大讯飞一直在跟踪人工智能专用芯片的前沿进展。早在2014年,科大讯飞就开始与寒武纪的早期研究团队开始沟通相关语音算法在处理器上的实现,并于2016年的天使轮注资寒武纪,2017年开始在寒武纪芯片上进行应用测试。科大讯飞于发布会上披露的测试结果表明,寒武纪的智能处理器在语音智能处理上交出了优异的答卷,能耗效率领先竞争对手的云端GPU方案达5倍以上。寒武纪智能处理器的强大处理能力使得手机本地端可以处理更加复杂的机器学习算法,使得语音本地识别准确率相对于传统处理器领先了9.8%,显著提高了用户体验。


附:寒武纪CEO陈天石的公开信


作为寒武纪的创始人和CEO,我非常自豪地与大家分享一个消息:2018年5月3日,寒武纪已在中国上海发布了首款云端智能芯片MLU100及相应的板卡产品。MLU100芯片主要用于云端的机器学习推断任务,可支持视觉、语音、自然语言处理等多种类型的云端应用场景,平衡模式下的等效理论峰值达128万亿次定点运算每秒,高性能模式下的等效理论峰值更可达166.4万亿次定点运算每秒,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。MLU100芯片是寒武纪发展历程上全新的里程碑,标志着寒武纪已成为中国第一家(也是世界上少数几家)同时拥有终端和云端智能处理器产品的商业公司。


寒武纪的创始团队来自学术界,我本人也是中科院计算所的教授和博士生导师。在过去十年的基础学术研究中,我们与国际同行紧密合作,为国际学术界和工业界同仁们奉献了一系列人工智能与处理器架构交叉研究的新思想。2013年前后,我作为主要参与者,与中科院计算所和法国国家信息与自动化研究所(Inria)的同事们一道见证了DianNao系列深度学习处理器架构在国际学术界引起的轰动性效应。如今我们非常自豪地看到,DianNao系列学术论文已经将智能处理器的创新思想播撒到全世界,得到哈佛、斯坦福、麻省理工、普林斯顿、英特尔、谷歌等顶尖国际机构的高频次学术引用,成为诸多国际顶尖大学处理器架构教学的重要资料,成为全世界每一家智能芯片设计公司无法忽略的参照。光荣属于中国科学院和Inria,属于我的长期学术合作者陈云霁教授和Olivier Temam教授,也属于我优秀的学生们;而知识,属于全人类。


DianNao系列的核心思想内涵在于不断追求智能处理最极致的性能。但要让学术界之外的普通民众都能受益于这样创新的思想,还需要更多的努力和协作。我走出实验室创立寒武纪的目的,就是要让全世界都能用上智能处理器,而不是让思想停留在论文纸面,落上历史的灰尘。“一花独放不是春,万紫千红春满园”,寒武纪在成立之初就延续了学术界开放、协作的精神,以处理器IP授权的形式与全世界同行共享公司最新的技术成果,帮助我们的全球客户能够快速设计和生产具备人工智能处理能力的芯片产品。公司研发的寒武纪1A(Cambricon-1A)是全球第一款商用终端智能处理器IP产品,赋能华为麒麟970芯片成为世界首款人工智能手机芯片,为华为Mate10、P20等四款手机插上智慧之翼。未来,更多的国内外客户也将陆续发布他们集成寒武纪处理器的芯片产品。这次发布会,我向大家介绍了寒武纪第三代处理器IP产品寒武纪1M的更多细节,期待与全球范围内的客户通力合作,将智能播撒到每一台终端,让整个地球都变得智能。


寒武纪在技术上贯彻“端云协作”的理念,在研发和推广终端处理器IP产品的同时,亦非常重视云端智能芯片的研发。这次发布的MLU100云端芯片,不仅其本身可以高效完成多任务、多模态、低延时、高通量的复杂智能处理任务,还可以与寒武纪1A/1H/1M系列终端处理器完美适配,以端云协作的方式为广大客户提供前所未有的智能应用体验。MLU100云端芯片是寒武纪的里程碑,是这家伟大创业公司征程的新起点,更是智能芯片领域的新标杆。我们期待与全世界人工智能和集成电路的上下游同行携手共进,从“芯”开始铸造人类社会的智能时代,向着全人类共同的美好未来前进。



登录查看更多
0

相关内容

北京中科寒武纪科技有限公司地址位于北京市海淀区科学院南路6号科研综合楼644室,主要从事计算机系统服务、软件开发等。
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
121+阅读 · 2020年5月22日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
295+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
阿里云发布机器学习平台PAI v3.0
雷锋网
12+阅读 · 2019年3月22日
Arxiv
14+阅读 · 2020年1月27日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
Top
微信扫码咨询专知VIP会员