什么?黄教主要打翻身仗?听上去有些不可思议对吗?可是目前的事实就是如此。
8 月发布的高端显卡系列: GeForce RTX 2080,RTX 2080 Ti,和 RTX 2070 才让游戏迷和 GPU 发烧友们兴奋不已,噩耗就传来了:价值 1200 美金的高端显卡 RTX 2080 Ti 竟然出现花屏问题。在硬重启或关机冷启动后,问题也不见得能彻底修复。
一些媒体对此事进行了独立调查(Gamers Nexus 收到了受难玩家寄来的一批 RTX 2080 Ti),初步怀疑美光的 GDDR6 显存模块是罪魁祸首。
虽然一开始保持死扛的态度,但是在网友们的狂轰乱炸之下,英伟达终于松口承认了问题的存在,并表示愿意提供协助,解决用户的问题。
英伟达的王牌产品竟然出现了问题,这简直有些难以置信,随着问题发酵,英伟达的新款显卡销路也一路下跌,临近 GTC China 2018,英伟达又遭遇了股价下跌的巨大打击,于是乎,这次的大会变身成了一场提升士气的活动,只不过效果是否真能达到黄教主的预期呢?
熟悉的热情似火,熟悉的皮夹克,熟悉的半吊子中文,是的,黄仁勋登场了。
有些激动,拍糊了
黄教主首先梳理了英伟达在计算机图像领域的进展。
15 年前,英伟达开发出可编程着色器 GPU,彻底改变了实时计算图形技术,Turing 正在引领计算机图形技术实现新一轮的图破。
Turing 可凭借超过 100TFLOPS 的处理速度处理深度学习模型,从而生成特效,增强图像质量,打造 AI 动画角色。
黄教主十分自豪地说 :英伟达再一次重新定义了计算机图形技术。
随后,黄仁勋展示了中国第一款 RTX 游戏:逆水寒,在展示中,可以看到:利用了反光回溯技术(RTX)的画面,图像更自然,细节更加逼真。
未使用 RTX
使用 RTX 之后
黄仁勋介绍到:Turing Tensor Core 支持深度学习超级采样(DLSS),这也就是为什么 Turing 可以使用革新的深度学习方法生成图像。
Turing DLSS 由两个模型生成,其中一个模型经过训练之后可根据原始图像生成超高画质的图象,另一个经过训练后可实现超级分辨率,并以此作为最终分辨率。
这一方法可以利用 Tensor Core 同时实现高画质和高帧率,原始图像经由 14TFLOPS 可编程着色器进行渲染,最终图像由 114TFLOPS 实现超分辨率。
黄仁勋补充说,通过 DLSS 可以实现 1.8 倍的性能,从下图可以看到清晰的对比,浅绿色的部分是使用了 DLSS 之后,GPU 提升的性能:
值得注意的是:使用 DLSS 之后,价格 499 美金的 RTX 2070 运行速度甚至超过了价格 699 美金的 Pascal 1080 Ti,估计此时黄教主的内心想法又是那句经典的:The more GPUs you buy,the more money you save 吧?
在黄仁勋看来,高性能计算将挑战摩尔定律,未来将出现两大趋势,第一:摩尔定律将终结,第二:AI 将推动计算变革。
摩尔定律将终结这一点不用多讲,黄仁勋认为 10 年间计算性能提高 100 倍的时代已经过去,只提高性能而成本不变并不现实。
而第二个趋势,AI 将变革计算。用于科学领域的 HPC 专为长时间云端的大型模拟而设计,因此需要最快的处理器、互联方式以及内存。
超大规模数据中心是互联网时代的产物,适用于 Hadoop 或者 MapReduce 分布式存储与计算。
黄仁勋同步了近几年的一些数据:英伟达已经在 10 年内为众多关键应用程序加速了 1000 倍,英伟达 CUDA sdk 的下载量已经接近 1400 万,仅去年一年就已经达到了 600 万。
他补充道:英伟达计算平台已经发展至爆发点,在没有 GPU 的情况下构建 100+ PetaFLOPS 机器是不切实际的,在没有加速计算的情况下,Exascale 是不可想象的。
目前能效最出色的 25 台计算机中,有 22 台都是由英伟达提供计算支持。
科学家们正在融合物理模拟和 AI 预测方法来创造更大的模型,与此同时,科学家们需要可以训练更加复杂、庞大模型的计算支持。
为了应对日益增长的计算需求,英伟达已经推出了一系列强大的硬件计算产品。
还记得 5 月发布的“核弹”HGX-2 吗?为了应对大规模的模拟仿真,英伟达推出了 V100 HGX-2,它连接了 8 个 V100 GPU,每个以 300GB/s 的速度与其他 GPU 通信,并以每秒 8TB 的速度访问所有 256 GB 显存。
HGX-2
如今,这一服务器平台已被广泛采用,最新采用 HGX-2 的企业包括:百度、腾讯、浪潮等,浪潮是中国首家构建 HGX-2 服务器的厂商。此外,甲骨文上月宣布其计划为甲骨文云基础设施部署英伟达 HGX-2 平台,并将采用裸机和虚拟机两种实例。
为了应对大规模计算的需求,今年 9 月,英伟达在日本发布了一款专为 AI 推理工作而设计的显卡,可以加速语音、视频、搜索引擎、图像神经网络,名为 Tesla T4 。演讲中,黄仁勋又一次演示了 T4 强大的计算能力。
T4 在训练和推理方面都很出色,FP32、FP16 TC、INT8 TC、INT4 TC 可以混合配合,实现最高性能的精度,它的理论性能可以从 65 TFLOPS 到 230 TFLOPS,只有 70W 的超低功耗适用于超大规模集群。
Tesla T4
黄仁勋说:T4,只是一个开始。他表示,英伟达的 server 可以用于推荐等各种目的,提升最大化利用率,降低使用成本。在演讲中,黄仁勋用最清晰的中文喊出:“这实在是太便宜了,这不是浪费,这是在省钱!”
使用前:功耗巨大,性能低下
使用后:不仅效率提升,功耗还有所降低
除了硬件,更大的数据量和摩尔定律的终结,促使业界创建了一个开源的 CUDA 加速堆栈;而 RAPIDS 加速了数据提取、数据抽取、加载转换处理和机器学习,黄仁勋介绍说,RAPIDS 端到端模型训练已经从小时缩短到分钟。
黄仁勋认为:新 HPC 市场在于科学计算、数据科学和 AI,借助 HGX-2、T4、RAPIDS 以及所有加速堆栈,英伟达启动加速整个新 HPC 生态的过程。
AI 让世界自动化说了这么多,话题又回到了 AI 上来。
黄仁勋认为:AI 是有史以来最强大的技术之一,它使得机器可以从大量的数据中学习,并具有推理的能力,让 AI 编写软件甚至已经成为了事实。
对于大多数行业来说,它们没有占统治地位的物理定律,也就意味着这些行业不存在模仿和改进其策略的基本原则方程。
借助人工智能,行业可以从海量数据中建立预测模型,并将这些模型应用到行业的环境和运作中去,如智能推荐、AI 医生、交通、工业等众多行业领域。
受 AI 赋能的众多行业
会上,黄仁勋演示了英伟达在 AI 自动化方面的应用。首先是去年发布的“新核弹”自主机器处理器 XAVIER。XAVIER 是第一个专为处理机器人计算业务流而设计的芯片,可用于机器人各项功能优化,京东、美团、菜鸟的运输机器人采用的,就是英伟达的 JETSON AGX XAVIER。
在自动驾驶方面,黄仁勋又介绍了一遍全球首个自动驾驶平台——NVDIA DRIVE 的详细情况。它的每个加速堆栈由 3 层组成,第一层是核心操作系统和引擎 API,第二层是算法加速器,第三层是特定于域的算法或应用程序。重要的是,每个平台都是开放的,开发人员可以访问并使用任何层。
其中,NVDIA DRIVE 平台包括用于驾驶员监控的 AI 智能体验的 DRIVE IX,开发套件 DRIVE AGX XAVIER,以及软件堆栈支持完全自动驾驶所需的功能的 NVDIA DRIVE AV。黄仁勋介绍道,目前,包括 VOLVO、Momenta 等在内的超过 370 家公司在自动驾驶生态中使用 DRIVE 平台。不久前,英伟达还在加利福尼亚进行了 50 公里自动驾驶测试。
不知道其他听众是什么想法,AI 前线记者身在现场感觉到:除了巨大的信息量之外,似乎没有什么特别吸引人的地方。你或许已经看到了:今天会上几乎所有介绍到的硬件产品都是之前发布过的——当然了,2018 年英伟达发布新品的数量已经足够多,甚至有些过剩了,而黄老板也仿佛在使尽全身解数来让听众相信:英伟达目前还很好。
如果你关注英伟达,你就会知道:这家公司目前正在经历异常艰难的一场寒冬。不知道是不是 GTC China 听众的热情让黄老板暂时忘记了最近的一些 bad news,也不知道这次的演讲对于英伟达的士气提升起到了多大的作用,透过黄教主热情的脸,我们看到的却是英伟达在这个冬天的艰难。
除了上文提到的 RTX 2080 Ti 花屏事件,英伟达的年关还有好几个难过的“坎”。
11 月 16 日,英伟达公布了 2019 财年第三季度财报。财报显示,其第三季度营收 31.8 亿美元,非 GAPP 每股摊薄收益为 1.84 美元,均低于分析师预期。有业内人士表示:这是英伟达 10 年来在资本市场的最差表现。
就在昨天,英伟达再度重挫,收跌 12%,两日暴跌超 28%,市值已不足 900 亿美元,自 10 月的高位已经腰斩。
对于即将到来的第四季度假期档,英伟达也给出了令人失望的预期业绩,Refinitiv 的机构经纪人预测系统(IBES)数据显示,英伟达预计第四季营收为 27 亿美元,上下浮动 2%,远低于分析师平均估计的 34 亿美元。
这样低迷的表现使得英伟达股价开盘暴跌约 18%,股价下滑至 164.43 美元 / 股,市值蒸发超 200 亿美元,直接跌出 1000 亿美金大关。有网友表示:英伟达这一下跌出去了一个 AMD。(截止上周五收盘时,英伟达竞争对手 AMD 市值为 201 亿美元。)
面对这样的情况,身为 CEO 的黄仁勋认为与加密货币热潮退散有直接关系。他表示,随着加密货币的狂热,英伟达游戏卡的价格上升,这使得一些买家望而却步。然而随着热潮消退,游戏卡的价格降了下来,英伟达希望那些被价格挡在门外的买家能再次回来,推动销量增长。
黄仁勋称,但这一过程是比英伟达预期的要缓慢。他预计,英伟达的库存水平将在本季度末回到正常水平。
旧芯片库存积压如山,新产品销售未达预期,英伟达目前的情况似乎不是简单缓解一段时间就能解决的。
对于对算力要求更大的加密货币产业来说,目前行业的颓势比所有人想象的都要严重,11 月 15 日凌晨,比特币价格跌破 6000 美元关口,最低跌至 5544 美元,创 2018 年来的新低。受到比特币拖累,以太币、莱特币和瑞波币等加密货币纷纷重挫。这让数字矿工挖掘加密货币逐渐成为一项无利可图的生意,并殃及上游芯片供应商。
而在英伟达专注发力的智能驾驶领域,由于落地实践速度远不如预期,英伟达也暂时没有从这一领域里收获太大。当然这也不仅仅是英伟达一家的遭遇,老对手 AMD 也在相同的问题上受到了困扰,从某种意义上来说,两位老对手又回到了同样的起跑线上。
本月 19 日,美国商务部工业安全局还出台了一份针对关键技术和相关产品的出口管制框架,人工智能相关的多项技术,如:算法、芯片等等也均名列其中,这无异于在这个冬天给芯片行业又泼了一盆冷水。
而就在昨天(20 日),疑似受这份技术出口管制的影响,美国几乎所有的科技行业都迎来了股价的暴跌,英伟达也深受其害···
这个年关,英伟达遇到的问题有些棘手,这个冬天,芯片市场有点儿冷。谁都想过个好年,可是这没人可以左右的资本市场却不想让人好过,眼看着就要到 2019 年了,黄教主,你想怎么做呢?
每年英伟达都会在全球多个城市巡回举办 GTC 大会(GPU Technology Conference),带来最新最酷的 GPU 新产品和突破性成果,如果你想要温习前几次 GTC 大会上老黄的精彩发言和 GPU 新产品发布情况,可以在 AI 前线 后台回复关键词:英伟达,获取过去几届 GTC 大会现场报道。
注:请在公众号对话框回复关键词,留言区回复收不到链接哦~
点击下方图片即可阅读
这可能是讲分布式系统最到位的一篇文章
AI 在物流、金融、电商、教育、视频等领域的最新落地应用有哪些?学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,涵盖机器学习、知识图谱、NLP、搜索推荐、语音识别等热门技术,干货满满。
12 月 20-21,相约 AICon,与 40+ 国内外一线 AI 技术大咖面对面交流,不见不散。目前大会门票火热销售中,凭“AICon-aifront”优惠码购票,立减 200 元,名额有限,先到先得!更多大会详情欢迎咨询票务小姐姐:18514549229(同微信),点击“阅读原文”更精彩。
如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!