首个Titan RTX深度学习评测结果出炉：2019年你该选择哪款GPU？

会员服务 ·

首个Titan RTX深度学习评测结果出炉：2019年你该选择哪款GPU？

2018 年 12 月 30 日 机器之心

选自 Lambda

作者：Michael Balaban

机器之心编译

参与：李亚洲、李泽南

英伟达的新一代 GPU 旗舰 Titan RTX 用来跑深度学习速度如何？近日，AI 硬件供应商 Lambda Labs 对 Titan RTX，以及 RTX 2080 Ti 等常见 GPU 在各种深度学习训练任务上的训练速度进行了测试。

结果喜人，由于新一代的英伟达 GPU 使用了 12 纳米制程的图灵架构和 Tensor Core，在深度学习图像识别的训练上至少能比同级上代产品提升 30% 的性能，如果是半精度训练的话最多能到两倍。看起来，如果用来做深度学习训练的话，目前性价比最高的是 RTX 2080Ti 显卡（除非你必须要 11G 以上的显存）。

Lambda 借助 TensorFlow 对以下 GPU 进行了测试：

Titan RTX
RTX 2080 Ti
Tesla V100 (32 GB)
GTX 1080 Ti
Titan Xp
Titan V

注意，作者只对单 GPU 对常见神经网络的训练速度进行了测试。

结果总结

我们测试了在训练神经网络 ResNet50、ResNet152、Inception3、Inception4、VGG16、AlexNet 和 SSD 时，以下每个 GPU 每秒处理的图像数量。

在 FP 32 单精度训练上，Titan RTX 平均：

比 RTX 2080Ti 快 8%；
比 GTX 1080Ti 快 46.8%；
比 Titan Xp 快 31.4%；
比 Titan V 快 4%；
比 Tesla V100（32 GB）慢 13.7%。

在 FP 16 半精度训练上，Titan RTX 平均：

比 RTX 2080 Ti 快 21.4%；
比 GTX 1080 Ti 快 209.7%；
比 Titan Xp 快 192.1%；
比 Titan V 慢 1.6%；t
和 v100（32 GB）的对比还有待调整。

结论：2019 年最合适深度学习/机器学习的 GPU 是？

如果 11 GB 的 GPU 内存足够满足你的训练需求（能满足大部分人），RTX 2080 Ti 是最适合做机器学习/深度学习的 GPU。因为相比于 Titan RTX、Tesla V100、Titan V、GTX 1080 Ti 和 Titan Xp，2080Ti 有最高的性价比。

如果 11GB 的 GPU 内存满足不了你的训练需求，Titan RTX 是最适合做机器学习/深度学习的 GPU。但是，在下结论之前，试试在半精度（16 bit) 上的训练速度。损失一定的训练准确率，能有效地把 GPU 内存翻倍。如果在 FP16 半精度和 11GB 上的训练还是不够，那就选择 Titan RTX，否则就选择 RTX 2080 Ti。在半精度上，Titan RTX 能提供 48GB 的 GPU 内存。

如果不在乎价钱且需要用到 GPU 的所有内存，或者如果产品开发时间对你很重要，Tesla V100 是最适合做机器学习/深度学习的 GPU。

方法

所有模型都是在一个综合数据集上训练的，从而把 GPU 的表现与 CPU 预处理的表现隔离开，且降低伪 I/O 瓶颈的影响。
作者对每个 GPU/模型对进行了 10 组训练实验，然后取平均值。
每个 GPU 的「归一化训练表现」均为在特定模型上每秒处理图像数量的表现与 1080Ti 在同样模型上每秒处理图像数量表现的比值。
Titan RTX、2080Ti、Titan V 和 V100 基准测试用到了 Tensor Cores。

硬件平台

测试中采用的硬件平台为 Lambda Dual 双 Titan RTX 桌面平台，包含英特尔 Core i9-7920X 处理器，64G 内存，看起来已经是最强台式电脑配置了。在测试时，Lambda 仅更换 GPU 配置。

Batch-sizes

系统软件环境

Ubuntu 18.04
TensorFlow: v1.11.0
CUDA: 10.0.130
cuDNN: 7.4.1
NVIDIA Driver: 415.25

初始结果

下表显示了在 FP32 模式（单精度）和 FP16 模式（半精度）下训练时每个 GPU 的初始性能。注意，数字表示的是每秒处理的图片数量，对数量进行了四舍五入。

FP32 - 每秒钟处理的图像数量

FP16 - 每秒钟处理的图像数量

自己运行基准测试

目前，Lambda Lab 的 GitHub 库中已经提供了所有基准测试的代码，你可以测试自己的机器了。

第一步：克隆基准测试的 Repo

git clone https://github.com/lambdal/lambda-tensorflow-benchmark.git --recursive

第二步：运行基准测试

输入正确的 gpu_index (default 0) 和 num_iterations (default 10)

cd lambda-tensorflow-benchmark
./benchmark.sh gpu_index num_iterations

第三步：报告结果

选择<cpu>-<gpu>.logs(generated by benchmark.sh) 目录；
使用同样的 num_iterations 进行跑分和记录。

./report.sh <cpu>-<gpu>.logs num_iterations

原文链接：https://lambdalabs.com/blog/titan-rtx-tensorflow-benchmarks/

本文为机器之心编译，转载请联系本公众号获得授权。

✄------------------------------------------------

加入机器之心（全职记者 / 实习生）：hr@jiqizhixin.com

投稿或寻求报道：content@jiqizhixin.com

广告 & 商务合作：bd@jiqizhixin.com

登录查看更多

相关内容

GPU

关注 29

【ICML2020-中科院】论文本生成中质量/多样性评价与分布拟合目标之间的关系

专知会员服务

17+阅读 · 2020年7月6日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【ACL2020-MIT-韩松】用于高效自然语言处理的硬件感知Transformer

专知会员服务

24+阅读 · 2020年5月29日

【经典书】深度学习，532页pdf，Deep Learning - A Practitioner's Approach

专知会员服务

138+阅读 · 2020年4月3日

【百度】-大规模深度学习广告系统的分布式分层GPU参数服务器，Distributed Hierarchical GPU PS

专知会员服务

24+阅读 · 2020年3月15日

【香港浸会大学】有效通信的分布式深度学习:一个全面的综述

专知会员服务

44+阅读 · 2020年3月10日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

【快讯】CVPR2020结果出炉，1470篇上榜，你的paper中了吗？

专知会员服务

51+阅读 · 2020年2月24日

模型压缩究竟在做什么？我们真的需要模型压缩么？

专知会员服务

28+阅读 · 2020年1月16日

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知会员服务

62+阅读 · 2019年12月25日

Colab 免费提供 Tesla T4 GPU，是时候薅羊毛了

机器之心

10+阅读 · 2019年4月25日

免费！Google Colab现已支持英伟达T4 GPU

新智元

5+阅读 · 2019年4月25日

助力深度学习！阿里开源可插拔 GPU 共享调度工具

云栖社区

8+阅读 · 2019年3月5日

2080Ti后，深度学习该选什么显卡？（补充RTX2070测评）

论智

94+阅读 · 2018年11月14日

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

深度学习 | 免费使用Google Colab的GPU云计算平台

沈浩老师

12+阅读 · 2018年2月4日

深度学习的GPU：深度学习中使用GPU的经验和建议

数据挖掘入门与实战

11+阅读 · 2018年1月3日

初学者如何选择适合的GPU？亚马逊AI科学家告诉你（指南）！

全球人工智能

6+阅读 · 2017年12月3日

深度学习中如何选择一款合适的GPU卡的一些经验和建议分享

AI研习社

6+阅读 · 2017年11月8日

前端高性能计算（4）：GPU加速计算

前端大全

7+阅读 · 2017年10月26日

Zero-Resource Cross-Lingual Named Entity Recognition

Arxiv

5+阅读 · 2019年11月22日

CAN-NER: Convolutional Attention Network for Chinese Named Entity Recognition

Arxiv

6+阅读 · 2019年4月30日

CAN-NER: Convolutional Attention Network forChinese Named Entity Recognition

Arxiv

16+阅读 · 2019年4月3日

Star-Transformer

Arxiv

5+阅读 · 2019年2月28日

Can LSTM Learn to Capture Agreement? The Case of Basque

Arxiv

3+阅读 · 2018年9月11日

Extracting Sentiment Attitudes From Analytical Texts

Arxiv

6+阅读 · 2018年8月27日

Coarse-to-fine Seam Estimation for Image Stitching

Arxiv

4+阅读 · 2018年5月24日

Sentiment Analysis of Code-Mixed Indian Languages: An Overview of SAIL_Code-Mixed Shared Task @ICON-2017

Arxiv

6+阅读 · 2018年3月18日

SQL-Rank: A Listwise Approach to Collaborative Ranking

Arxiv

6+阅读 · 2018年2月28日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

10+阅读 · 2018年2月17日

VIP会员