英伟达工程师亲授「如何加速NVIDIA GPU上的训练、推理和机器学习应用?」108页ppt

2020 年 1 月 8 日 专知

Maggie Zhang,Nathan Luehr,Josh Romero,Pooya Davoodi和Davide Onofrio深入研究了用于加速深度学习训练和推理的通用深度学习和机器学习工作负载的技术。 通过本教程将了解DALI如何消除现实应用中的I/O和数据处理瓶颈,以及自动混合精度(AMP)如何轻松地在Volta GPU上的训练性能提高3倍。 您将看到使用Horovod进行多GPU和多节点扩展的最佳实践。 他们使用深度学习探查器来可视化TensorFlow操作并确定优化机会。 本教程将教读者学习使用TensorRT(TRT)中的INT8量化来部署这些训练过的模型,所有这些都将在TensorFlow框架的新型便捷API中进行。


地址:

https://conferences.oreilly.com/tensorflow/tf-ca-2019/public/schedule/detail/79348

嘉宾介绍:

Maggie Zhang是NVIDIA的深度学习软件工程师,她在深度学习框架上工作。 她获得了澳大利亚新南威尔士大学的计算机科学与工程博士学位。 她的研究方向是GPU和CPU异构计算,编译器优化,计算机体系结构和深度学习。

Nathan Luehr是NVIDIA的一名高级开发人员技术工程师,他致力于加速深度学习框架。 他拥有斯坦福大学的博士学位,在那里他致力于加速GPU上的电子结构计算。

Josh Romero是NVIDIA的一名开发技术工程师。 他在GPU计算方面拥有丰富的经验,从移植和优化高性能计算(HPC)应用程序到深度学习的最新工作。 Josh拥有斯坦福大学的博士学位,其研究重点是开发新的计算流体动力学方法以更好地利用GPU硬件。

Pooya Davoodi是NVIDIA的高级软件工程师,致力于在NVIDIA GPU上加速TensorFlow。 之前,Pooya从事Caffe2,Caffe,CUDNN和其他CUDA库的研究。

Davide Onofrio是NVIDIA的高级深度学习软件技术营销工程师。 他专注于NVIDIA的面向开发人员的深度学习技术开发和演示。 Davide在生物识别,VR和汽车行业的计算机视觉和机器学习工程师方面拥有多年经验。 他在米兰理工大学获得了信号处理博士学位。



便捷查看下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“NGPU” 就可以获取如何加速NVIDIA GPU上的训练、推理和ML应用?专知下载链接索引


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看5000+AI主题知识资料
登录查看更多
2

相关内容

Maggie Zhang是NVIDIA的一名深度学习软件工程师,工作是开发深度学习框架。她在澳大利亚新南威尔士大学获得了计算机科学和工程博士学位。研究背景包括GPU和CPU异构计算、编译器优化、计算机架构和深度学习。
【干货书】高级应用深度学习,294页pdf
专知会员服务
149+阅读 · 2020年6月20日
【课程】伯克利2019全栈深度学习课程(附下载)
专知会员服务
54+阅读 · 2019年10月29日
以BERT为例,如何优化机器学习模型性能?
专知
10+阅读 · 2019年10月3日
深度学习了解一下(附53页Slides)
专知
48+阅读 · 2019年5月20日
DLI 精选课程 | 用TensorRT 优化和部署TensorFlow模型
英伟达NVIDIA中国
5+阅读 · 2019年3月8日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
13+阅读 · 2018年12月6日
Bidirectional Attention for SQL Generation
Arxiv
4+阅读 · 2018年6月21日
Arxiv
6+阅读 · 2018年3月28日
Arxiv
4+阅读 · 2018年3月23日
Arxiv
3+阅读 · 2018年3月13日
VIP会员
Top
微信扫码咨询专知VIP会员