来源:TechSugar
其面积42225 平方毫米,拥有1.2 万亿个晶体管,400000 个核心,片上内存18G字节,内存带宽19PByte/s,fabric带宽100Pbit/s。是目前芯片面积最大的英伟达GPU的56.7倍。
这颗芯片——Cerebras Wafer Scale Engine(简称:Cerebras WSE),由人工智能初创公司Cerebras Systems公司推出。之所以吸引眼球,一部分原因是当外界不断追求芯片小型化、低功耗时,这颗芯片反其道而行之。
Venturebeat发文称,大芯片可以更快地处理信息,在更短的时间内产生结果。减少洞察时间或“训练时间”,使研究人员能够测试更多想法,使用更多数据并解决新问题。谷歌,Facebook,OpenAI,腾讯,百度和许多其他人认为,如今人工智能的基本限制是培训模型需要很长时间。因此,缩短训练时间消除了整个行业进步的主要瓶颈。
有意思的是,这家公司极其低调。连自家官网的介绍都少的可怜,在领英上简单一句——“Cerebras是一家低调的创企。我们是一批成功的创业者,我们敢于去解决那些别人无法解决的问题。在我们的团队里,大家重视团结、热情、对实际问题的解决能力,当然幽默感也必不可少。我们期待着更多的优秀人才加入我们。”
在Cerebras Systems官网的新闻栏目处,只有寥寥几篇文章。最新的三篇则是关于这颗巨大芯片的发布。
今年2月份,CB Insights发布的人工智能产业链中最有前途的100家AI公司,其中就有Cerebras Systems。
在去年5月份一篇关于创始人Andrew的采访稿中,Andrew把Cerebras比作猎豹,是人工智能领域的专才,而英特尔、英伟达属于人工智能通才,靠自己的架构来解决所有计算问题。并称人工智能的大创新不可能来自芯片而是一个系统,Cerebras做的就是一个系统。
这为数不多介绍,让这家公司越发神秘感,今天TechSugar小编就为大伙扒一扒这家公司,先从技术高层团队开始。
据官网资料介绍,Cerebras Systems由顶尖计算机架构师、计算机科学家和深度学习研究人员组成的团队。目标是构建一种新的计算机系统,可以将人工智能加速到超越现有技术数量级水准。据官网介绍,Cerebras Systems已经拥有150名员工。
Cerebras Systems联合创始人兼CEO
其拥有斯坦福MBA学位,在创立Cerebras Systems之前,Andrew Feldman是SeaMicro公司的联合创始人兼首席执行官,SeaMicro是低功耗服务器技术的先驱,已被AMD收购。
在创立SeaMicro之前,Andrew Feldman担任Force10的营销和产品管理副总裁(被戴尔以8亿美元收购),以及Riverstone Networks的企业营销和企业发展副总裁,从Riverstone Networks成立直到首次公开募股。
据官网高管信息栏介绍,Gary Lauterbach是Cerebras Systems的联合创始人兼首席技术官。Gary被公认为业界顶尖计算机架构师之一。
在加入Cerebras之前,他是SeaMicro的联合创始人兼首席技术官。在此期间,Gary是美国能源部一个930万美元节能计算经费项目的首席研究员。SeaMicro被收购后,Gary担任企业荣誉理事(Corporate Fellow)以及服务器/服务器CPU部门的CTO。
职业生涯早期,担任Sun Microsystems工程师职位,在那里他职位是UltraSPARC III和UltraSPARC IV微处理器的首席微处理器架构师。在Sun Laboratories期间,他是DARPA HPCS Petascale计算项目的首席架构师。Gary拥有50多项专利。
Dhiraj是Cerebras Systems公司工程和业务开发副总裁。此前,Dhiraj在英特尔、AMD以及SeaMicro和NexGen等初创企业拥有超过20年的高管领导经验,指导大型、高性能的工程团队。
在Cerebras之前,Dhiraj是英特尔200亿美元数据中心业务的首席技术官和副总裁。
再往前,他是SeaMicro执行领导团队的成员之一,SeaMicro被AMD收购后,他继续在AMD担任服务器解决方案部门的公司副总裁和总经理。此外,Dhiraj还是几家风投支持的公司的顾问,其拥有斯坦福大学电气工程硕士学位。
Sean是Cerebras Systems的首席硬件架构师和联合创始人。在Cerebras之前,Sean是SeaMicro输入/输出(I/O) 虚拟化Fabric ASIC的首席硬件架构师。在SeaMicro被AMD收购后,Sean成为AMD的研究员和数据中心首席架构师。
在他职业生涯的早期,就在AMD的高级架构团队中工作了五年。他拥有麻省理工学院电子工程学士学位和计算机科学学士和工程硕士学位,并在计算机架构方面拥有16项专利。
在Cerebras Systems之前,Michael是SeaMicro负责分布式系统软件的首席软件架构师。SeaMicro被收购后,Michael成为AMD的首席软件架构师。
在他的职业生涯中,他设计过操作系统、编译器、实时反馈控制系统、信号处理和识别系统。Michael拥有加州大学伯克利分校的分子神经生物学、数学和计算机科学学位。
J.P.是Cerebras Systems的首席系统架构师。在共同创建Cerebras之前,J.P.是DSSD(后被EMC收购)全新机架级闪存(Rack-scale Flash)的高级硬件架构师。
在DSSD之前,J.P.是SeaMicro的首席系统架构师,他设计了三代基于Fabic的计算机系统。
在他职业生涯的早期,J.P.曾任阿尔卡特朗讯(Alcatel-Lucent)硬件工程总监和Riverstone Networks的硬件工程总监。他拥有瑞士洛桑联邦理工学院电气工程硕士学位,及其18项专利。
在上面这些技术高层的简历中,你会发现一个公司频频被提起,那就是SeaMicro。显然,这帮人几乎都来自这个团队。SeaMicro也是一家颇具传奇色彩的公司。
SeaMicro成立于2007年7月,创始人就是上面提到的Andrew Feldman、 Gary Lauterbach ,外加一位叫Anil Rao的人。该公司分别于2007年和2009年获得A轮和B轮融资。
2010年6月份,SeaMicro发布了一款重量级产品,外媒形容为“原子弹”级别产品。一个配备512个Intel Atom芯片的服务器,该产品可以获得超级计算机性能,但功耗和空间比现有服务器低75%。
SeaMicro将虚拟化的概念应用于服务器内部。创始人Andrew Feldman设计的定制芯片可以承担超出英特尔微处理器及其芯片组所能处理的任务。自定义芯片虚拟化所有其他组件,以便在需要时找到资源。
其第一代产品SM10000于2010年7月份上市,每台售价139,000美元。2011年7月,该公司发布了第三代服务器——SM10000-64 HD。资料显示,第三代服务器拥有384个1.66GHz双核Atom N570处理器,1.536TB DDR3 DRAM,多达64个SATA SSD或HDD,以及16个10GbE或64个1GbE上行链路。起步价237,000美元。
在2012年2月,AMD宣布3.34亿美元收购SeaMicro。收购的前一个月,SeaMicro在推出新的服务器设计时,英特尔管理人员表示这可能会占据服务器市场的10%。(新品SM10000-XE是围绕英特尔的至强服务器处理器和三星的内存芯片构建的。)
收购前,SeaMicro已有50多个客户,其中包括eHarmony,Skype和Mozilla。
图:(从左到右)AMD首席执行官Rory Read,SeaMicro首席执行官Andrew Feldman和AMD全球业务部门总经理Lisa Su。
被AMD收购后,SeaMicro创始人之一的Andrew Feldman负责监督AMD服务器芯片业务。
2014年AMD重组,当时44岁的Lisa Su升为AMD首席运营官(COO),而Andrew Feldman选择离职,称“休息一下”。现在看来,他应该正在召集人马谋划一场新创业——Cerebras Systems。
SeaMicro的命运并没有像创始人那般春风得意,在2015年4月16日,AMD宣布放弃SeaMicro业务,而专注于高性能服务器CPU。
2016年,Andrew Feldman带领一众老部下创立了Cerebras Systems。根据PitchBook的数据显示,Cerebras Systems已经进行了三轮融资,首先是2016年5月份的2700万美元的A轮,当时估值达到估值为6450万美元。2017年1月,经2500万美元的B轮融资后,其估值迅速上升至2.45亿美元;6个月后,Cerebras再筹集6000万美元,估值达8.6亿美元。
Cerebras Systems融资情况 图源:Craft
现如今来看,该人工智能公司似乎前景一篇大好。回顾该创始人的经历,巨型芯片的思路并不陌生,在SeaMicro期间,创始人们玩的就是“巨无霸”技巧。
Fieldman 表示:“Cerebras WSE”专为人工智能设计而设计,其中包含了不少基础创新,解决了限制芯片尺寸的长达数十年的技术挑战 - 如芯片良率,功率传送、封装等,推动了最先进技术的发展。和包装,每个架构决策都是为了优化AI工作的性能。结果是,Cerebras WSE根据工作量提供了数百或数千倍的现有解决方案的性能,只需很小的功耗和空间。”
在Cerebras WSE介绍的白皮书中,有这么一句话——“通过加速人工智能计算,WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟,从几周减少到基瞄。让深度学习实践者更快的验证自己的假设,从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本,加速了人工智能新思想和新技术的到来。”
张亚勤、刘慈欣、周鸿祎、王飞跃、约翰.翰兹联合推荐
这是一部力图破解21世纪前沿科技大爆发背后的规律与秘密,深度解读数十亿群体智能与数百亿机器智能如何经过50年形成互联网大脑模型,详细阐述互联网大脑为代表的超级智能如何深刻影响人类社会、产业与科技未来的最新著作。
《崛起的超级智能;互联网大脑如何影响科技未来》2019年7月中信出版社出版。刘锋著。了解详情请点击:【新书】崛起的超级智能:互联网大脑如何影响科技未来
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”