华为「硬」生生把AI搞出暴力美学

会员服务 ·

华为「硬」生生把AI搞出暴力美学

2020 年 9 月 30 日 量子位

金磊发自凹非寺
量子位报道 | 公众号 QbitAI

「华为速度」，在AI计算领域到底该如何评价？

一言以蔽之：暴力美学。

而且这种速度，由浅及深地拆分来看，可以分为两层。

首先，是物理意义上的超高速度。

这种能力在刚刚结束的第十六届全国高性能计算学术年会（CCF HPC China 2020），最能直接展现。

在这场全球范围内、高性能计算领域最具影响力的三大顶会之一上，华为Atlas 900凭借其超强的AI算力，打破自己创下的纪录，在ResNet-50上的跑分仅需28秒。

其次，是更深层次的华为AI速度。

从2018年华为全联接大会（HC）首次对外宣布AI战略开始，仅仅2年时间，便在技术、产业、人才和生态各方面，展露出了「领军姿态」。

现在，是时候完整揭秘一下华为AI的暴力美学了。

Atlas 900速度如何问鼎业界第一？

Atlas 900，从去年9月诞生开始，便打上了「世界最快AI产品」的标签。

训练ResNet-50只需要59.8秒，比当时排名第二的选手快出了15%之多。

而时隔短短一年，Atlas 900超越自己，再次创造了世界纪录。

在HPC大会上，华为昇腾计算业务CTO 周斌介绍道：

Atlas 900凭借其超强的AI算力，使得ResNet-50的训练时间仅需28秒！相比去年59.8秒的测试成绩缩短一半以上，体现了Atlas 900软硬件协同优化的持续演进能力。

△华为昇腾计算业务CTO 周斌

据介绍，集群芯片数量仅为1024颗昇腾910芯片，而其它同类产品在芯片数量方面都要比Atlas要多，甚至达到了2倍。

并且，从单芯片算力来看，昇腾910能够达到320TFLOPS的超高算力。

在算力飞速迭代、发展的今天，Atlas 900能够保持业界第一，离不开其背后的一套「杀手锏」。

这套「杀手锏」就是华为AI计算中心解决方案。

多样性算力方面，支持GPU和NPU资源统一调度和管理。

除此之外，还提供端边云协同、统一运维、全栈服务等能力，这就使得Atlas 900在全球范围内具备竞争力。

而这，就是华为在硬件方面的暴力速度。

但在拥有了这样的速度之后，用来做什么，也是一个值得思考的问题。

华为AI发力HPC，Why？

此次大会中，华为昇腾计算业务CTO周斌的一番演讲，道出了问题的答案。

「我们处在爆炸式创新前夜」，这是周斌首先抛出来的一个观点。

以数据量为例，从今年的44ZB，预计到2025年，便会增长到180ZB；智能互联网设备将从340亿增长到1500亿；计算中心AI的工作量将从现在的小于10%，增长到80%……

虽然高性能计算（HPC）在处理海量数据问题时，能够带来一定的优势，但面对如此爆炸性增长，还是远远不够。

新增的大量数据、接入设备，对计算带来了空前的挑战。

对此，周斌在现场抛出了他的观察：

AI和HPC的融合，是未来发展的一大趋势。

AI改变传统HPC计算的求解方法。

例如，2018年入围「Gordon Bell」决赛的6个应用中，有半数用AI+HPC融合的应用示范。

再者，在高性能计算领域著名榜单Top500中，近30%系统拥有加速卡/协处理器。换言之，越来越多的系统配有大量低精度算术逻辑单元，用来支撑人工智能计算能力需求。

尤其榜单前十名都使用AI计算的能力。

并且，「AI+HPC」已经在众多领域崭露头角：

在全球气象领域，美国国家大气研究中心(NCAR) 用CNN网络预测冰雹概率, 用82000个不同的风暴样本训练后，测试32000个已知的风暴样本，冰雹预测准确率达88%。
在监控地球脉动方面，美国国家航空航天局 (NASA) 开发出通过深度学习网络 DeepSat，用于实现卫星图像分类和分割。
在医学领域，佛罗里达大学和北卡罗来纳大学结合使用深度学习，开发出一种神经网络引擎，该引擎能够以超低成本生成计算快速的高精度分子模拟，用于药物研发。

而这些工作、研究，若是仍旧采用传统HPC手段来处理，不仅成本上会有大量的消耗，效率方面也会大打折扣。

一言蔽之，「AI+HPC，让一切皆可计算」。

这也正是华为发力HPC的原因，以Atlas 900为代表的「华为速度」也逐渐在此生根发芽。

然而，Atlas 900的速度，也只是华为AI暴力速度的冰山一角。

如何评价华为AI的速度？

暴力美学，为何可以这样评价。

其实，回顾一下华为AI这两年的发展，便可知其一二。

首先，是于技术。

华为Atlas人工智能计算解决方案，可以说是近年来华为在AI技术发展中的集大成者。

从2018年首次提出，到现在仅仅2年时间，发展到了「云边端」全场景布局，而且在互联网、金融、能源、制造等众多领域实现了落地。

再以「昇腾AI全栈」为例：

AI算子开发方面，「异构计算架构CANN」在两年时间里迭代到了3.0版本。
AI模型开发方面，全场景AI计算框架MindSpore在今年3月份正式开源，仅6个月后，便发布1.0版本。
AI应用开发方面，MindX 1.0极简易用的特性，能满足那些没有深度开发能力的开发者；以及ModelArts也已步入了3.0时代，从训练数据到模型落地一站式打通。
全流程开发工具链 MindStudio2.0，涵盖了算子开发、模型训练、模型推理、应用开发和应用部署。

当然，以昇腾为基础的AI全栈，也已成型。

而它们的搭建，仅仅才2年时间。

其次，产业维度，一组数据就能说明问题。

以鲲鹏、昇腾为基础的发展过程中，已经涵盖了30万开发者、1000+合作伙伴、3000+解决方案认证，并且还在以每月，甚至是每周的速度在迭代更新。

以如此速度在AI产业大步向前行进，道路的坎坷程度可想而知，而华为却说到做到。

以及，于人才、开发者和高校。

华为已经在70+所高校开设了AI课程，积累了10万+开发者进行AI开发，凝聚出了120多个行业智能化转型解决方案。

今年，华为也会在推进AI技术研发的同时，再度加码生态培育——投入2亿美元发展计算产业生态。

所以这种「暴力美学」，也会更快让高校和产业用得上、用得起、用得好~

— 完 —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容，未经账号授权，禁止随意转载。

榜单征集！7大奖项锁定AI TOP企业

「2020中国人工智能年度评选」正式启幕！将从公司、人物、产品、社区四大维度共7个奖项寻找优秀的AI企业，欢迎大家扫码报名参与。

榜单将于12月揭晓，也期待与百万从业者们，共同见证这些优秀企业的荣誉！

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

周斌

关注 0

周斌，华为昇腾计算业务CTO、山东大学信息科学与工程学院教授。主持多项重大科研项目，包括GPU版本的天气预报模式Grapes、人脸检测识别系统和视频处理系统、人工智能处理器芯片等。主要研究方向为异构计算系统和体系架构、深度学习和机器学习、并行计算和信号处理、基于深度学习的目标检测、分类、识别和跟踪等研究等。曾任中国科学技术大学、北京航空航天大学和乔治梅森大学客座及讲席学者，NVIDIA CUDA Fellow 。拥有10多项国内外专利，发表论文20多篇。

【NeurIPS 2020】图神经网络GNN架构设计

专知会员服务

84+阅读 · 2020年11月19日

中国工业机器视觉产业发展白皮书，31页pdf

专知会员服务

103+阅读 · 2020年11月14日

5G边缘计算的价值机遇

专知会员服务

66+阅读 · 2020年8月17日

华为发布《自动驾驶网络解决方案白皮书》

专知会员服务

129+阅读 · 2020年5月22日