职播回顾 | 超高算力在人工智能领域如何应用?技术专家带你实战解读

2019 年 10 月 18 日 AI科技评论

作者 | AI 科技评论


「职播间」第14讲邀请到了ZILLIZ解决方案副总裁魏一来做主题为「数据科学的下一程——超高算力在人工智能领域的应用」的分享。


内容涉及数据科学的定义,数据时代的今天与未来以及ZILLIZ对新一代数据科学提出的解决方案,观看完整视频回放,可跳转文末点击“阅读原文”查看。


社长小tip:登陆网站完善完善个人资料,可以下载更多嘉宾课件and超级无敌多技术资料哦~


分享嘉宾

魏一,ZILLIZ 解决方案副总裁,同济大学计算机硕士,先后就职于SAP、EMC、Pivotal等IT公司,为国内知名企业规划、搭建大数据处理平台,并核心参与设计、实施解决方案。拥有逾10年的大数据平台架构设计和实施经验。
回顾要点

本文对整场分享进行了要点总结及PPT整理,以帮助大家提前清晰地了解本场分享重点。
1.ZILLIZ如何重新定义数据科学?

2.数据时代的今天与未来

3.传统架构和异构计算有什么区别?

4. ZILLIZ对新一代数据科学提出了什么样的解决方案?

5. ZILLIZ人才观分享与人才招聘

回顾正文

以下为ZILLIZ解决方案副总裁魏一的部分分享内容,【AI研习社】在不改变原意的基础上做了整理和精编:

大家好,我是ZILLIZ的魏一,从事数据科学领域已有十余年,今天和大家分享ZILLIZ在数据科学领域如何将GPU的算力应用在人工智能领域。

首先简单介绍一下ZILLIZ,公司成立于2016年,专注于异构计算的数据科学领域。公司的使命是Reinvent Data Science,即通过使用异构加速这种新的计算模式,解决数据科学领域的难点和痛点。

关于重新定义数据科学,魏一表示:

重新定义数据科学其实是往两个方向在努力,一个是数据化,传统来说即结构化的数据处理,不过近几年随着神经网络、人工智能算法地使用,可以对以前很难分析的非结构化数据进行分析,比如图形图像的处理、人脸识别、音频、视频、文本等。还有一个是数据如何呈现真实的世界,如何做到通过使用数据更好地加快决策的过程?在这方面我们有针对边缘数据、快数据、时空数据的可视化分析引擎。

随着时代的发展,全球数据规模呈现指数级增长,伴随5G的到来,还会有更大更密的数据连接,在算力层面,GPU架构会超过CPU。

接下来是ZILLIZ对新一代数据科学提出的解决方案,我们的两个产品分别是MegaWise和Milvus,这两个产品分别是对应前面讲到的两部分——数据化和数据现实,通过这种数据科技的整合,可以把以前比较慢的工作、或者一些算法的训练、以及数据计算的工作进行加速,然后能够对实时数据进行处理,这就是我们公司主要的两款产品。

那么传统架构和异构计算有什么区别呢?对传统架构来说,一般都是从外存加载到内存再加载到CPU的缓存进行就算,对异构计算来说,可以从磁盘直接把数据加载到GPU的显存里,通过CPU和GPU的联手,让其更好地发挥算力,进而将之前在CPU上很难处理或无法处理的工作,进行有效的提升和加速。这就是我们产品设计的最核心的思想和架构。

现在来介绍一下Milvus这款产品,是针对非结构化数据处理而设计的检索产品,可对到高维度、百亿级向量数据的进行秒级检索,能有效降低硬件成本(至少一个数量级)。通过异构计算的核心算法设计,能够在所有人工智能相关领域中使用,比如,人脸识别,语音识别,视频分析,文本分析等,能够为深度学习领域的推理部署进行性能提升和有效的成本控制。

整个系统的架构图如下:

Milvus提供了不同的向量检索算法,能够针对不同的业务场景只能选择最合适的算法从而实现最高的性能比。

索引系统的性能检测报告如下图:

现在,Milvus在Github正式开源啦,欢迎各位开发者在Github关注我们https://github.com/milvus-io/milvus!

再让我们来看一下在数据现实的核心产品——MegaWise,是结构化数据处理的核心引擎,深度整合了Nvidia Rapids的数据科学平台。从图中可以看出产品是建构在Nvidia Rapids异构数据科学平台之上的,通过整合各种数据分析处理组件,实现了对时空数据的高性能分析,很好的支持了上层可视化交互平台。同时,自主研发的Picasso 图形渲染引擎,能够对数亿级别的时空信息进行秒级渲染并通过Inifi可视化分析平台为数据科学家提供了超大规模数据现实分析能力。

接下来讲一个在MegaWise数据分析引擎的应用场景,通过这种图形化的展示,可以更直观地解决地理信息数据中的难点。

以上是本次分享的部分技术内容,更多详细讲解请观看视频回放。

在本次公开课的最后,ZILLIZ的人力资源总监对公司成长历程、文化氛围等做了介绍,同时ZILLIZ的秋招和社招也正在火热进行中,欢迎感兴趣的同学投递简历,和ZILLIZ一起开拓智能数据处理新疆界。

今天的分享就到这里,谢谢大家。

AI研习社职播间/大讲堂已举办超150场, 往期分享嘉宾分别来自斯坦福大学、卡内基梅隆大学、剑桥大学、北京大学、清华大学、加州伯克利等高校,也有腾讯、百度、阿里、科大讯飞、地平线、旷视科技、商汤科技、Momenta、微软等知名企业高管

比如微软亚洲研究院院长洪小文、海康威视首席科学家浦视亮、Momenta L4负责人陈凯、深鉴科技CEO姚颂等。

每月10+场,分享前沿技术、人才需求。如果你是有AI人才招聘的企业,欢迎勾搭社长,提交资料(姓名+公司+职位+主题)报名AI职播间分享。

联系我们:18319013243


我们希望天下学AI者都有用武之地!

AI职通车还在成长中,期待你的加入~

点击 阅读原文,查看公开课视频回放。



招聘

1

论文内容运营

AI研习社是一个服务AI学生、学者、从业者的UGC内容平台,目标是从教学课程、技术经验分享、学术见解讨论、比赛和工作机会等角度提供资讯,也是用户输出观点、互相交流、打造个人品牌的土壤。

工作内容:

1. AI研习社社区论文板块运营

2. 联系、维护外部兼职稿源

3. 参与多样化内容输出、活动策划

4. 参与社区产品的长期维护和改进

任职要求:

1. 有一定IT、计算机科学知识见闻

2. 热情友善,善于沟通

3. 英语能力是加分项

简历投递地址:yangxiaofan@leiphone.com

招聘

2

论文内容编辑(可招实习生)

AI研习社是一个服务AI学生、学者、从业者的UGC内容平台,目标是从教学课程、技术经验分享、学术见解讨论、比赛和工作机会等角度提供资讯,也是用户输出观点、互相交流、打造个人品牌的土壤。

工作内容:

1. 关注、了解人工智能相关领域学术研究动向,形成兼具专业度和传播力的报道内容(发表在雷锋网、公众号以及AI研习社社区)

2. 采访高校学术青年领袖,输出人工智能领域的深度观点;

3. 解读国内外学术热点,深入剖析学术动态

任职要求:

1. 理工科背景,有一定计算机科学知识

2. 英语好,能阅读英文科技网站&博客

3. 乐于钻研,认真严谨;有文字功底更佳

简历投递地址:yangxiaofan@leiphone.com

招聘

3

兼职外翻

AI研习社是一个服务AI学生、学者、从业者的UGC内容平台,目标是从教学课程、技术经验分享、学术见解讨论、比赛和工作机会等角度提供资讯,也是用户输出观点、互相交流、打造个人品牌的土壤。

工作内容:

1. 翻译一些人工智能相关领域的学术动态、技术博客等(文章发表在雷锋网、公众号以及AI研习社社区)

2.无需坐班,工作时间、地点自由

任职要求:

1.英文读写能力较强,能阅读英文科技网站&博客

2.具备一定的计算机科学知识,能看懂相关的专业词汇

3.认真严谨,做事不拖拉,能够按时完成派下来的外翻任务

简历投递地址:xinglijuan@leiphone.com

登录查看更多
0

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
专知会员服务
80+阅读 · 2020年6月20日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
338+阅读 · 2020年3月17日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
120+阅读 · 2019年10月10日
40+一线大厂AI落地案例指南|年终干货总结
InfoQ
8+阅读 · 2018年11月18日
【人工智能】深度学习的应用和价值、深度学习综述
【人工智能】180页PPT,讲解人工智能技术与产业发展
《人工智能标准化白皮书(2018版)》发布|附下载
人工智能学家
17+阅读 · 2018年1月21日
【重磅】《人工智能标准化白皮书(2018)》发布(完整版)
【回顾】迁移学习的发展和现状
AI研习社
8+阅读 · 2017年11月17日
Python机器学习Kaggle案例实战
炼数成金订阅号
12+阅读 · 2017年8月10日
范式大学|迁移学习实战:从算法到实践
机器学习研究会
16+阅读 · 2017年8月9日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Area Attention
Arxiv
5+阅读 · 2019年2月5日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
8+阅读 · 2018年12月6日
Arxiv
7+阅读 · 2018年8月28日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
6+阅读 · 2016年1月15日
VIP会员
相关资讯
40+一线大厂AI落地案例指南|年终干货总结
InfoQ
8+阅读 · 2018年11月18日
【人工智能】深度学习的应用和价值、深度学习综述
【人工智能】180页PPT,讲解人工智能技术与产业发展
《人工智能标准化白皮书(2018版)》发布|附下载
人工智能学家
17+阅读 · 2018年1月21日
【重磅】《人工智能标准化白皮书(2018)》发布(完整版)
【回顾】迁移学习的发展和现状
AI研习社
8+阅读 · 2017年11月17日
Python机器学习Kaggle案例实战
炼数成金订阅号
12+阅读 · 2017年8月10日
范式大学|迁移学习实战:从算法到实践
机器学习研究会
16+阅读 · 2017年8月9日
相关论文
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Area Attention
Arxiv
5+阅读 · 2019年2月5日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
8+阅读 · 2018年12月6日
Arxiv
7+阅读 · 2018年8月28日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
6+阅读 · 2016年1月15日
Top
微信扫码咨询专知VIP会员