报告主题:Modular convolution considered beneficial

报告摘要

miOpen包含性能关键的GPU内核,在AMD的ROCm平台上驱动机器学习的工作负载。Jack Chung、Chao Liu和Daniel Lowell探索了如何将它们制作成模块,这样它们就可以很容易地为来自AMD的各种GPU硬件进行调整,并与TensorFlow XLA等图形编译器紧密结合。他们展示了各种卷积算法是如何在AMD的硬件上实现的,如何将它们分解成模块,如何被XLA提取和融合,以及如何执行。

邀请嘉宾

郑文衡(Jack Chung)是AMD的PMTS软件开发工程师,他从ROCm堆栈的早期开始就在那里工作。他有编译器前端、优化传递和高级语言的运行时方面的经验。他的重点是TensorFlow XLA。

Chao Liu是AMD的一名软件开发人员,他在AMD从事开源高性能深度学习库miOpen的工作。他的兴趣包括开发并行算法和各种应用的数值方法,包括深度学习和基于物理的仿真。在此之前,他开发了计算流体动力学、有限元分析、迭代求解和网格生成等技术。

Daniel Lowell是AMD的深度学习GPU内核库miOpen的团队领导和软件架构师。在此之前,他曾在AMD的高性能计算(HPC)领域从事编译技术和可靠性方面的研究。他的兴趣包括深度学习、脑机接口、自动代码生成和高性能计算。

成为VIP会员查看完整内容
Modular convolution considered beneficial Presentation.pdf
1

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【泡泡图灵智库】GCNv2:高效关联预测实时SLAM(arXiv)
泡泡机器人SLAM
44+阅读 · 2019年4月15日
Java开发者必看!机器学习开发库精选
云栖社区
5+阅读 · 2018年8月22日
6月5日凌晨开幕!扒一扒苹果WWDC的秘密战略
全球人工智能
3+阅读 · 2018年6月4日
2017年四巨头的深度学习框架之战,你支持谁?
全球人工智能
6+阅读 · 2017年12月29日
分布式机器学习平台比较
云栖社区
4+阅读 · 2017年8月13日
CoCoNet: A Collaborative Convolutional Network
Arxiv
6+阅读 · 2019年1月28日
Arxiv
4+阅读 · 2018年4月30日
Arxiv
8+阅读 · 2018年1月25日
VIP会员
相关VIP内容
相关资讯
【泡泡图灵智库】GCNv2:高效关联预测实时SLAM(arXiv)
泡泡机器人SLAM
44+阅读 · 2019年4月15日
Java开发者必看!机器学习开发库精选
云栖社区
5+阅读 · 2018年8月22日
6月5日凌晨开幕!扒一扒苹果WWDC的秘密战略
全球人工智能
3+阅读 · 2018年6月4日
2017年四巨头的深度学习框架之战,你支持谁?
全球人工智能
6+阅读 · 2017年12月29日
分布式机器学习平台比较
云栖社区
4+阅读 · 2017年8月13日
微信扫码咨询专知VIP会员