在NIPS 2017发布Titan V:首次搭载Volta的消费级GPU | 快讯

2017 年 12 月 9 日 AI研习社 思颖

NIPS 2017 正在美国举办,白天的精彩不断,晚上也有人搞事情:12 月 7 日,在白天的正会结束之后,黄仁勋在旁边的希尔顿酒店开了个 party。

「前半小时是一般的吃饭聊天,然后老黄上场,借着发奖的名义把 Rus,Yoshua 等大佬都拉上台走了一圈,以显示趴体的逼格。到这里都算正常,然后爆炸的就来了。一段炫酷视频后,老黄发布了 Titan V,volta 版 Titan。」party 现场的解浚源同学如是说道。

据悉,NVIDIA Titan V 集成了英伟达最新一代 GPU 技术——Volta 架构 GV100,拥有 12GB HBM2 显存,峰值浮点性能为 110 TFlops,是 TITAN Xp(12T)的 9 倍,为黑色和金色两种颜色搭配。

据解浚源介绍,Titan V 的速度在 fp32 下是 Titan Xp 的 1.5 倍,在 fp16 下是 Titan Xp 的 3 倍。当然,价格自然也感人,Titan Xp 售价 1200 美元,而 Titan V 则达到 2999 美元。红红火火恍恍惚惚。(这时有很多同学表示哭晕在厕所,也有同学弱弱地问,Titan Xp 会降价吗?)

财大气粗的黄教主说,这都不是事,大手一挥,现场抽奖赠送 20 块。

作为第一块搭载 Volta 架构的消费级 GPU(售价大概是 2w 人民币),Titan V 的性能比起上一代搭载 Pascal 架构的 Titan Xp 有了哪些提升?

据AI研习社了解,Volta 架构 GV100 GPU 采用台积电(TSMC)12nm FFN 制程,具有 5120 个 CUDA 核心。相比上一代 16nm 制程的 Pascal 架构 GPU GP100,晶体管数目增加了 38%,达到了惊人的 211 亿个;核心面积也继续增加 33%,达到令人生畏的 815mm2,约等于一块 Apple Watch 的面积。

据黄仁勋称,这样的面积已经达到了制造工艺极限。随着核心的增大,GV100 的单、双精度浮点性能也大幅提升了 41%。然而这还不是重点,为了满足 GPU 在机器学习中的性能需求,Volta 架构中引入了新的张量运算指令 Tensor Core,让机器学习中训练速度提升约 3 倍、推理性能提升约 10 倍(相比上一代自家 GPU GP100)。

黄仁勋在 party 现场表示,「我们希望 Volta 能打破高性能计算和人工智能的极限,目前,基于这种先进的处理器架构、指令、数字格式、内存架构和处理器链接,我们已经在新的领域取得了突破。Titan V 发布之后,全世界的研究人员和科学家都能使用我们的 Volta 架构了,迫不及待地想看看他们将会带来什么突破性的发现。」

Titan V 主要参数如下:

目前,Titan V 已经在官网接受预定,不过每个账户最多只能买两块,地址如下:http://t.cn/RYFKKoM,壕的同学可以开始预定然后体验啦。

上海交通大学博士讲师团队

从算法到实战应用

涵盖CV领域主要知识点

手把手项目演示

全程提供代码

深度剖析CV研究体系

轻松实战深度学习应用领域!

▼▼▼  

(限时早鸟票~)



新人福利




关注 AI 研习社(okweiwu),回复  1  领取

【超过 1000G 神经网络 / AI / 大数据,教程,论文】


深度学习中如何选择一款合适的GPU卡

  

登录查看更多
1

相关内容

解浚源,字节跳动联邦学习系统架构师。2019年取得华盛顿大学计算机专业博士学位,主要研究计算机视觉方向。曾经在Amazon AI负责深度学习算法和系统研发,是开源深度学习框架MXNet的主要开发者和维护者之一。
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
36+阅读 · 2020年6月17日
【ACL2020-Facebook AI】大规模无监督跨语言表示学习
专知会员服务
34+阅读 · 2020年4月5日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
107+阅读 · 2020年1月2日
Colab 免费提供 Tesla T4 GPU,是时候薅羊毛了
机器之心
10+阅读 · 2019年4月25日
1500+ FPS!目前最快的CNN人脸检测算法开源
极市平台
25+阅读 · 2019年3月15日
一文看尽2018全年计算机视觉大突破
人工智能前沿讲习班
8+阅读 · 2019年1月4日
已删除
将门创投
7+阅读 · 2018年11月5日
哇~这么Deep且又轻量的Network,实时目标检测
计算机视觉战队
7+阅读 · 2018年8月15日
前端高性能计算(4):GPU加速计算
前端大全
7+阅读 · 2017年10月26日
TResNet: High Performance GPU-Dedicated Architecture
Arxiv
8+阅读 · 2020年3月30日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
7+阅读 · 2018年2月26日
Arxiv
10+阅读 · 2018年2月17日
Arxiv
4+阅读 · 2015年8月25日
VIP会员
相关资讯
Colab 免费提供 Tesla T4 GPU,是时候薅羊毛了
机器之心
10+阅读 · 2019年4月25日
1500+ FPS!目前最快的CNN人脸检测算法开源
极市平台
25+阅读 · 2019年3月15日
一文看尽2018全年计算机视觉大突破
人工智能前沿讲习班
8+阅读 · 2019年1月4日
已删除
将门创投
7+阅读 · 2018年11月5日
哇~这么Deep且又轻量的Network,实时目标检测
计算机视觉战队
7+阅读 · 2018年8月15日
前端高性能计算(4):GPU加速计算
前端大全
7+阅读 · 2017年10月26日
Top
微信扫码咨询专知VIP会员