开源软件平台RAPIDS如何加速数据科学?| 超级公开课NVIDIA专场预告

2018 年 12 月 24 日 智东西

大数据分析流程大致分为数据准备、数据合并、数据降维等。在数据准备阶段,数据科学家需要先下载数据,然后还要进行数据抽取、数据转换、数据加载等,而且一般情况下数据包都非常大,所以数据科学家大部分时间是在等待数据准备好,因此有人戏称,数据科学家不是在喝咖啡就是在去喝咖啡的路上。随着数据量越来越大,数据科学家处理数据所需时间也越来越长,导致工作效率非常低。


在今年GTC Europe大会上,NVIDIA发布了一款针对数据科学和机器学习的GPU加速平台RAPIDS,该平台构建于Apache Arrow、PANDAS和SKLEARN等组件之上,通过CUDF数据过滤、CUML机器学习、CUGRAPH数据图像化来加速处理数据,为数据科学家提供标准化的流水线式工具,数据处理速度较仅用CPU提升50倍,大大提高了数据科学家的工作效率。


12月27日晚8点,超级公开课NVIDIA专场第17讲将开讲,由NVIDIA解决方案架构师孙鹏主讲,主题为《开源软件平台RAPIDS如何加速数据科学》。



课程信息

时间:12月27日20点

地点:「高性能计算」社群


讲师介绍

孙鹏,NVIDIA解决方案架构师,中国科学院大连化学物理研究所物理化学博士。博士期间从事分子反应动力学理论研究,负责组内GPU程序开发,参与国内RAPIDS首批用户测试工作。


课程详情

主题:开源软件平台RAPIDS如何加速数据科学

提纲:

1.数据科学面临的挑战

2.开源软件平台RAPIDS架构解读

3.RAPIDS安装及使用方法

4.XGBoost算法简介

5.RAPIDS应用案例分享


入群路径

本次课程我们将设置主讲群,讲师将亲自入群交流。希望进入主讲群与老师认识和交流的朋友,可扫描海报上的二维码添加智东西公开课联络员“动动(zhidxzb)”为好友,添加时请备注“姓名-公司-职位或姓名-学校-专业”,申请进入主讲群。

快速通道

扫描下方二维码,直接填写听课申请表,即可获取听课名额。我们将尽快与您联系。

登录查看更多
0

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
【机器学习课程】机器学习中的常识性问题
专知会员服务
74+阅读 · 2019年12月2日
CMU博士论文:可微优化机器学习建模
专知会员服务
59+阅读 · 2019年10月26日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
深度学习之星(二):GAN之图像转换 | 公开课
AI研习社
3+阅读 · 2017年12月11日
深度学习系列之三:循环神经网络 | 公开课
AI研习社
6+阅读 · 2017年12月2日
Deeplearning4j的介绍与实例分享 | 公开课
AI研习社
14+阅读 · 2017年11月27日
深度学习系列之二:卷积神经网络 | 公开课
AI研习社
3+阅读 · 2017年11月24日
A Modern Introduction to Online Learning
Arxiv
20+阅读 · 2019年12月31日
Arxiv
12+阅读 · 2019年4月9日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
VIP会员
Top
微信扫码咨询专知VIP会员