CCCF专题 | 张云泉:2016年中国高性能计算机发展现状分析与展望

2017 年 10 月 21 日 中国计算机学会 张云泉

点击上方中国计算机学会轻松订阅!

来源:《中国计算机学会通讯》2017年第10期《专题》


背 景

从1993年起,国际上每年都会按Linpack的性能测试结果,公布前500名在世界范围内已安装的高性能计算机排名。排名现已成为高性能计算机研制生产、市场发展、应用交流和趋势分析预测的重要参考。

2002年以前,我国的高性能计算机未向国际申报Linpack性能测试结果,故而未进入国际TOP500排行榜。2002年,中国软件行业协会数学软件分会首次发布了中国高性能计算机排行榜TOP50。在中国TOP50排行榜中名列第一的联想深腾1800万亿次机群,名列那一年世界TOP500第43名,结束了中国在世界TOP500排行榜没有排名的历史。此后,联想深腾6800万亿次机群,名列2003年世界TOP500第14名;2004年,曙光4000A取得世界TOP500排行榜第10名的成绩。中国也开始引起世界关注。

2010年9月,我国发布的国产天河一号A千万亿次超级计算机通过采用先进的CPU+GPGPU的异构混合加速体系架构,以2.56PFlops的Linpack性能夺取2010年11月世界TOP500排行榜的第一名。这是中国超级计算机首次夺得世界冠军。我国安装的超级计算机的上榜数量也首次超越日本和欧盟,排名世界第二,仅次于美国。这个成绩标志着我国超级计算机硬件的研制水平达到国际领先水平。2013年6月,由国防科技大学研制的天河二号超级计算机,再次夺取世界TOP500第一名。

迄今为止,中国研制的天河系列超级计算机已经七次夺取世界第一,其中天河二号取得了六连冠的辉煌成绩,使中国在世界TOP500超级计算机冠军俱乐部中站稳了脚跟。

2016年,中国大陆的超算系统在2016年6月和11月的世界TOP500的数量也创历史纪录,6月首次超过美国,排名世界第一,11月与美国持平。联想生产的超算系统首次闯入世界前二强,仅排在美国HPE之后。2016年,中国超级计算系统不仅连续八次夺取TOP500世界第一,连续两次夺取TOP500数量冠军,还在第29届国际超算大会(SC16)上首次获得戈登·贝尔奖。更为可喜的是,由中国科技大学教授安虹带领的大学生团队,还代表中国一举夺得世界大学生集群大赛的Linpack单项冠军和总冠军。

2016年,对于中国超算界来说,可谓“中国超算大满贯年”。超级计算系统作为计算科学的必备基础设施,已经成为国家之间的战略必争点和创新转型的利器,各国都投入巨资争夺世界制高点。经过十多年的快速发展,中国超算系统的研制水平和能力已跻身世界先进水平的行列。美国虽然仍是世界超算的强国,但其数量已经降低到不足35% 的份额,难以恢复20年前独霸世界TOP500 70%的盛况。

中国软件行业协会数学软件分会联合国家863高性能计算机评测中心和中国计算机学会(CCF)高性能计算专委会,于2016年11月发布了中国高性能计算机TOP100排行榜。此次测评是按照国际惯例选用的Linpack测试进行的。本文对中国TOP100数据进行了深入分析与展望。

总体性能分析

  图1和表1分别给出了中国TOP100的总体性能发展趋势以及TOP10的计算机情况。

图1 中国高性能计算机年度性能发展趋势

表1 中国高性能计算机TOP10 (2016.11)

与2016年11月发布的世界TOP500高性能计算机相比较,可以得出以下结论:

2016年11月,世界TOP500的总Linpack性能达到了672PFlops,是2015年418.3 PFlops的1.6倍;而2016年中国TOP100的总Linpack性能是197.82PFlops,是2015年85.1PFlops的2.33倍,增速从过去几年的一倍快速提高到两倍。世界超级计算的发展正在逐渐走出前几年的低谷,开始迎来复苏。

中国研制的神威·太湖之光超级计算机,以93PFlops的Linpack性能,毫无悬念地从天河二号手中将世界冠军的荣耀接了过来,并在2016年蝉联了两次世界TOP500冠军,使得中国研制的超级计算机8次站在了世界TOP500的冠军位置上。天河二号连续三年占据中国TOP100排行榜第一名的位置,也在2016年被神威·太湖之光替代。中国高性能计算的发展终于走出停滞期,进入一个新的活跃期。

2016年11月,世界TOP500高性能计算机的Linpack性能都超过了349TFlops。2016年中国TOP100高性能计算机的Linpack性能都超过了515TFlops,中国TOP100的上榜门槛再次超过世界TOP500,且差距在持续拉大。中国TOP100中仍然有96个系统是机群,机群体系架构的数量继续保持绝对优势。其中,采用异构加速体系架构的机器数量达到了24套,而且由过去的集中在前几名和比较大的机器,变为分散在TOP100的计算机中。这个变化表明,随着深度学习等大数据应用的普及,GPU加速的异构体系结构获得了更广泛的应用。

世界TOP500中排名前 10的最低性能都超过了8PFlops,其中4台由克雷(Cray)公司制造,2台由IBM,2台由富士通公司制造。我国有2 台,1 台由国家并行计算机工程中心制造,1 台由国防科技大学制造。高端能力超算的研制呈现出几家独大的局面,中、美、日、欧都在积极占领制高点,而且都发布了2020年前后的E级超级计算机研制计划,准备抢占下一个制高点。中国TOP100中,前10的最低性能都大于900TFlops,其中4台由曙光公司制造,3台由国防科技大学制造,神威、联想和惠普公司各占1台。

世界TOP500中有462套系统使用Intel处理器,占比92.4%。但是采用异构加速体系架构的系统数量不升反降,从2015年的104套系统降低到2016年只有83套系统采用加速部件。但是,中国TOP100的情况与世界TOP500相反,2016年有24套系统采用了GPU/MIC加速,比2015年的15套大幅度上升。大数据特别是深度学习算法在互联网公司的成功应用应该是主要原因。

亚洲国家在世界TOP500中的机器数量大幅度上升,2016年,从2015年的173台猛升为200台以上。排行榜中有171套系统来自中国大陆,总数与美国并列第一;来自日本的系统从37套降低为27套。虽然中国的数量与美国并列第一,但我们应该清醒地认识到,其中绝大部分的机器并非传统的科学计算应用,而是新兴的互联网应用。

目前中国TOP100排行榜中机器的平均Linpack性能为1.98PFlops,是2015年850TFlops的2.33倍,增速明显。2016年世界TOP500排行榜中机器的平均Linpack性能为1.34PFlops。国内和国际排行榜的平均性能双双首次超过1PFlops。出现跨越式发展的主要原因是我国发布的神威·太湖之光和天河二号超级计算机的Linpack性能就占到了中国TOP100总性能的64%。如何使神威·太湖之光和天河二号发挥其巨大的计算能力,成为未来两三年中国超级计算行业面临的挑战性问题。

制造商分析

图2 中国TOP100制造商机器数量份额图(2016.11)

2016年,中国TOP100排行榜上国内外厂商的上榜机器数量份额如图2所示。与以往相比,变化不是很大。美国厂商制造的机器数量急剧下降到装机总数的2%,与国内厂商的98%份额差距明显。国产超级计算机在国内市场已经占据绝对主导地位,前三名分别是曙光(34%),连续8年占据中国TOP100数量份额第一名的位置;联想公司通过对IBM公司x86 HPC产品线的并购,第三次在机器数量份额上取得与曙光并列第一的成绩且发展势头强劲,已经对曙光的冠军位置构成威胁;而浪潮(19%)虽然再次夺得第三名,但是份额有小幅度下降。华为公司作为高性能计算机厂商再次出现在2016年的TOP100 上,并占据了5%的份额。惠普公司曾经连续多年夺得中国TOP100排行榜冠军,但目前仅仅有两套系统在榜单上。目前,中国的超算市场初步形成了曙光、联想和浪潮三足鼎立的格局,且占据85%以上的份额,国外厂商正在逐渐退出中国市场。这与其在TOP500上的表现是极其不相称的。曙光和联想公司虽然夺得装机数量的并列第一名,但其机器总性能远低于神威和国防科技大学的机器。曙光公司作为第一家以高性能计算机为主营业务上市的高科技厂商,联想和浪潮对其冠军位置构成强烈威胁。如何继续维持其领先位置,值得曙光重视。

国内厂商在逐渐获得国内市场的垄断优势之后,开始纷纷布局国际市场。华为和联想是跨国公司,具备先发优势。而浪潮和曙光公司2016年在国际市场也开始有所斩获。可以预见,超级计算系统会成为中国继高铁之后,另一个可以出口的中国制造的高科技产品。

从2016年中国TOP100排行榜上国内外厂商的机器性能来看(见图3),第一名由神威从国防科技大学手中夺取,其性能接近总性能的50%。国防科技大学、曙光公司、联想公司和浪潮公司分列第二到第五名。国产超级计算机的总性能超过了TOP100总性能的97%,在数量和性能上都占据了压倒性的优势地位。

图3 中国TOP100制造商机器性能份额图(2016.11)

行业领域分析

从2016年11月发布的中国TOP100的行业应用领域来看(见图4),国内高性能计算主要分布在互联网大数据、互联网服务、政府部门、超算中心、云计算、信息安全、大气气象、教育、科学计算、电力、视频计算、电子商务、半导体、电信等14个领域。领域数量与2015年持平。从应用领域的机器数量份额上看,互联网大数据领域的机器数量占47%,首次排名第一,份额上升30%;互联网服务领域占14%,份额有所下降,降为第二;政府部门占9%,首次进入前三名;超算中心和云计算领域占7%,并列第四名。互联网服务和互联网大数据领域的机器数量份额之和超过60%,成为2016年中国超算应用的新热点。这与中国互联网公司的快速崛起和大数据中的深度学习算法的广泛应用有很大关系。互联网公司通过深度学习算法发现了超级计算机特别是GPU加速的异构超级计算机的价值,纷纷投入巨资建设新系统。

图4     中国TOP100行业应用领域机器系统份额图(2016.11)

图5   中国TOP100行业应用领域机器性能份额图(2016.11)

从2016年中国TOP100应用领域的机器性能份额上看(见图5),超算中心的机器性能占66.85%,继续保持第一的位置,而且占据了接近2/3的性能份额;互联网大数据占16.34%,虽然机器数量接近一半,但是其性能份额却只有1/6,说明该领域的机器目前主要是中等规模且Linpack的效率偏低;互联网服务占5.23%,份额大幅下降,降为第三;政府部门占3.28%,继续保持第四;云计算占2.87%,该领域的机器数量虽然不少,但是总性能偏低,排第五名。

综合来看,互联网大数据、互联网服务、超算中心、云计算、政府部门和信息安全等领域是高性能计算的主要用户。互联网大数据领域增长强劲。2016年没有出现新的应用领域。

图6 中国TOP100应用领域趋势(2003~2016)

根据历年积累的数据,图6给出了中国TOP100从2003年到2016年的应用领域趋势图。按产学研三个大领域粗略划分,学,主要是指教育,研,主要是指科研机构(超算中心、大气气象、生物信息、科学计算等),其他的都算作产业。2016年TOP100应用领域中,产学研三者的数量比为87∶1∶12,产业占87%。产学研三者在TOP100应用领域中的比例关系与2015年相比几乎没有变化。但是专门用于高性能计算教育和科研用的超算环境一直在较低的数量徘徊,降低到只有两套的地步,当然,其中很大一部分科学计算转移到了六家国家超级计算中心,并未消失。超算中心的机器数量份额虽然只占7%,但其性能份额仍然排名第一,且几乎达到总性能的2/3,说明我国对国家超级计算中心的投入在2016年随着两套100PFlops超算系统的升级和研制接近完成,产生了更多的影响和效果。2016年,天河二号仍未按计划如期升级到100PFlops,期待在2017年完成升级。中国超算军团2016年首次在世界超算舞台上实现了冠军位置的领跑。目前,中、美、日、欧等国家和地区都已经公开发布了其未来E级超级计算系统的研制计划,几乎都希望在2020~2024年发布E级系统,夺取世界第一。我国“十三五”规划在经历科技部的科研管理体制改革之后,设立了三个E级原型系统的研制课题,分别由国家并行计算机工程中心(计划安装在山东)、曙光公司(计划安装在上海和深圳)和国防科技大学(计划安装在天津)牵头负责研制,并在2018年选定冲击E级超级计算系统的研制方和安装地点。

展 望

从图1中第一名峰值趋势可以看出,根据新收集的数据可以得到新的预测结果:累计Linpack性能将在2017~2018年达到1000PFlops。峰值EFlops的机器将在2018~2019年出现。综上所述,2016年的TOP100排行榜主要体现了以下趋势:

  • 国防科技大学蝉联8次中国TOP100第一名的情况被神威·太湖之光终结;

  • 曙光公司连续8年保持中国TOP100数量份额第一名;

  • 联想公司第三次与曙光公司并列数量份额第一名;

  • TOP100总体性能突破197.92PFlops,中国高性能计算市场的增速回暖;

  • TOP100平均性能突破1.98千万亿次,大幅超过国际TOP500的平均性能1.38PFlops,继续领先国际平均水平;

  • 系统性能入门门槛继续大幅提升,达到500TFlops,再次大幅度超过国际TOP500的349TFlops;

  • 98套系统采用机群结构,计算机体系结构创新形势依然严峻;

  • 国产申威系列处理器占据2%的处理器份额,增长了1%;

  • 国防科技大学高性能网络占据4%的高速互联网络份额,没有继续扩大国产高性能互联网络的份额趋势;

  • 上榜高性能计算机制造商减少为7家,市场份额进一步集中在国内厂商,曙光、联想和浪潮三家厂商就占据了87%的数量份额;

  • 应用领域继续保持15个,高性能计算应用在大数据和云计算领域呈现快速发展的局面。互联网大数据、互联网服务、超算中心、云计算和网络安全等是高性能计算的主要用户。

展望2017年,国家超算广州中心的天河二号能否如期在2017年完成从55PFlops升级到100PFlops的计划,并再次凭借中国加速部件夺取世界第一,令人充满期待。三套E级原型系统的研制是否顺利,最后的研制任务花落谁家,都值得关注。届时,两套国产100PFlops系统全部正式投入服务,能否支撑国产超算应用取得新的更大突破和进展,并再次夺得戈登·贝尔奖,让我们拭目以待。

脚注和参考文献请查看【阅读原文】。

作者:张云泉

CCF杰出会员、常务理事。中国科学院计算技术研究所计算机体系结构国家重点实验室研究员,博士生导师。国家超级计算济南中心主任。主要研究方向为并行算法与并行软件。

zyq@ict.ac.cn

登录查看更多
0

相关内容

High Performance Computing. For example, IBM's Blue Gene
生物数据挖掘中的深度学习,诺丁汉特伦特大学
专知会员服务
67+阅读 · 2020年3月5日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
电力人工智能发展报告,33页ppt
专知会员服务
126+阅读 · 2019年12月25日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
5G全产业链发展分析报告
行业研究报告
11+阅读 · 2019年6月7日
2019中国养老产业发展剖析与发展趋势分析报告
行业研究报告
8+阅读 · 2019年5月18日
2018年德国汽车产业研究报告
行业研究报告
16+阅读 · 2018年12月1日
CCF发布2017-2018中国计算机科学技术发展报告
中国计算机学会
17+阅读 · 2018年11月7日
【学科发展报告】生物信息学
中国自动化学会
11+阅读 · 2018年10月22日
【学科发展报告】多媒体分析
中国自动化学会
6+阅读 · 2018年9月29日
《中国人工智能发展报告2018》(附PDF下载)
走向智能论坛
19+阅读 · 2018年7月17日
智慧停车行业深度研究与分析报告
智能交通技术
4+阅读 · 2018年3月20日
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
Arxiv
35+阅读 · 2019年11月7日
CoCoNet: A Collaborative Convolutional Network
Arxiv
6+阅读 · 2019年1月28日
Dynamic Transfer Learning for Named Entity Recognition
Arxiv
3+阅读 · 2018年12月13日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
14+阅读 · 2018年5月15日
VIP会员
相关资讯
5G全产业链发展分析报告
行业研究报告
11+阅读 · 2019年6月7日
2019中国养老产业发展剖析与发展趋势分析报告
行业研究报告
8+阅读 · 2019年5月18日
2018年德国汽车产业研究报告
行业研究报告
16+阅读 · 2018年12月1日
CCF发布2017-2018中国计算机科学技术发展报告
中国计算机学会
17+阅读 · 2018年11月7日
【学科发展报告】生物信息学
中国自动化学会
11+阅读 · 2018年10月22日
【学科发展报告】多媒体分析
中国自动化学会
6+阅读 · 2018年9月29日
《中国人工智能发展报告2018》(附PDF下载)
走向智能论坛
19+阅读 · 2018年7月17日
智慧停车行业深度研究与分析报告
智能交通技术
4+阅读 · 2018年3月20日
Top
微信扫码咨询专知VIP会员