智能与新硬件时代下的云计算技术展望

2019 年 10 月 11 日 中国计算机学会


本论坛将于CNCC2019第二天,10月18日下午,在苏州金鸡湖国际会议中心A215会议室举行。论坛将邀请中科院、华东师大、阿里、Xilinx、字节跳动等多位学术界和工业界专家学者共同论道智能与新硬件时代下的云计算技术展望,敬请期待!



论坛引言:

云计算从2006年AWS EC2提出开始,至今已发展了13年。从早期对基础设施资源的虚拟化和按需供应,到逐步提供多种形态的PaaS服务,再到近年来,随着人工智能与新型硬件的发展,云计算技术又将至一个新阶段,在基础设施构建、服务质量保证、高效资源管理等方面面临着新的机会和挑战。


本论坛拟邀请工业界和学术界的专家学者,围绕智能时代和新硬件发展下的云计算关键技术与挑战,发表观点,充分交流,论坛将重点讨论以下内容:


+ 基于FPGA的云平台加速计算

+ 基于AEP和RDMA新型硬件的大规模云基础设施

+ 云计算数据中心超高速网络技术

+ 面向混合云负载的大规模资源调度与智能管理

+ 面向云应用和新硬件的高性能数据库技术

+ 差异化云租户服务质量保证技术


论坛议程



讲者和报告简介


喻之斌



报告题目:面向共享云的垂直标签化时空共享任务调度抽象


演讲摘要:当前面向共享云的操作系统,例如Mesos和YARN,采用两层架构。将云应用框架和底层的资源管理基础架构进行解耦,这导致不同层之间的调度机制互不感知,从而造成资源浪费。本报告将介绍一个时空共享的任务调度抽象TPShare,通过高效的vertical label机制协调不同层上的空间共享和时间共享的调度器。Vertical label机制在不同层之间传递信息,不同层上的调度器基于label消息进行决策。我们在Mesos、Spark和Flink中实现了label机制。我们的实验结果表明TPShare机制能有效减少资源浪费。和Mesos相比,TPShare能将Flink应用的尾延迟平均降低48%,最高降低120%。


嘉宾简介:博士,中国科学院深圳先进技术研究院研究员,主要研究兴趣为计算机体系结构、计算系统虚拟化、云计算以及大数据分析平台构建与优化。在顶级国际会议ISCA,ASPLOS、PACT、IPDPS、SIGMETRICS等和顶级期刊IEEE TC, IEEE TPDS,ACM TACO等上发表论文70余篇。主持过国家重点研发计划课题,多项国自然面上项目,以及参与973项目和国家自然科学基金重点项目。



刘洪强



报告题目:面向云计算超高速网络的拥塞控制机制


演讲摘要:数据中心网络速率从10年前的1Gbps增加到目前的100Gbps,以及未来会增加到400Gbps。但是,由于目前的拥塞控制机制无法在超高速网络上同时实现高带宽、低延迟和稳定性三个目标,因此上层云应用无法充分利用超高速网络的优势。本报告将介绍高精度拥塞控制机制HPCC。HPCC利用in-network telemetry(INT)获得精确的链路负载信息并精准地控制流量。HPCC同时解决了INT信息滞后问题和针对INT信息的过激操作,因此HPCC可以快速利用空闲带宽,并且维持近似为零的in-network队列从而实现超低延迟。HPCC的实现基于商业化的可编程网卡和交换机。


嘉宾简介:刘洪强博士是阿里巴巴的高级技术专家。刘洪强在清华大学获得学士和硕士学位,并于2014年在耶鲁大学获得计算机科学博士学位。刘洪强博士的研究兴趣主要包括高性能网络,网络验证与测试,virtual networking,container networking,programmable data plane networking(P4)和边缘计算。刘洪强博士在SIGCOMM,SOSP,NSDI等顶级会议上发表十余篇论文。刘洪强博士是2015年ACM SIGCOMM Doctoral Dissertation Award - Honorable Mention的获得者。在加入阿里巴巴前,刘洪强博士在微软研究院Redmond实验室工作,提出并实现了大规模网络模拟器CrystalNet。



罗浩



报告题目:AEP和RDMA在字节跳动基础设施的应用实践


演讲摘要:字节跳动一直致力通过混合部署提升资源利用率, 在基础设施层, 我们在过去一年探索通过虚拟化实现计算和存储大规模混合部署, 避免业务之前的相互干扰, 同时也积极尝试利用RDMA技术实现SSD盘拉远实现存储池化, 以及利用AEP进一步降低成本。


嘉宾简介:罗浩,目前在字节跳动负责IaaS, 虚拟化, SDN相关方向, 10多年IT和互联网相关工作经验, 曾供职于阿里云, 华为Cloud BU, VMware等多家知名企业。



周烜



报告题目:云时代数据库系统的产品形态与技术演进


演讲摘要:云计算平台带来的收益是多方面的:1. 免除繁琐的系统维护工作、2. 简化应用开发和部署过程、3. 实现底层系统和上层应用设计的进一步隔离,从而可以更自主地实施底层的优化。在云计算平台上提供数据库服务,用户同样期望获得以上三方面的收益。然而,数据库系统的功能和构造是相当复杂的,系统的部署、使用和维护都需要丰富的技巧和经验。这使得数据库系统的云化并不容易。本次报告将总结现有云数据库系统的产品和实现技术,并对未来的技术发展方向作展望。


嘉宾简介:周烜,华东师范大学数据科学与工程学院副院长、教授。2001年本科毕业于复旦大学,2005年在新加坡国立大学取得博士学位,2005年至2010年期间先后在德国 L3S 研究中心和澳大利亚联邦科工组织从事科研工作,随后在中国人民大学信息学院任教6年,最后于2017年3月加入华东师范大学。他的研究兴趣包括数据库系统和信息检索技术。他曾参与和负责多个国内外的科研项目和工业合作项目,开发各种数据管理系统。他的若干学术成果在国际一流的会议和期刊上发表。



唐杰



报告题目:FPGA加速数据中心存储数据路径


演讲摘要:目前的大型数据中心正在从基于SCSI协议组的接口向基于NVMe的存储协议过渡,如何能够高效使用基于Flash的存储介质是一个热门问题。作为FPGA的加速方案,可以帮助大型数据中心目前在基于消息机制的协议中可以实现数控分离,进而提供灵活多变的数据通路,不仅可以卸载CPU的数据传输的负载,同时可以支持部分常用的数据存储服务如:加密,压缩等等。目前SNIA工业界成立了计算存储的工作组,正在定义基于NVMe的接口标准,从而实现存储的计算加速。


嘉宾简介:唐杰,工学硕士。Xilinx公司数据中心架构师。主要从事大型数据中心的异构计算方案的架构设计。目前和大型数据中心客户合作实现对于计算,存储和网络的加速,主要关注NVMe-OF的存储池化方案以及NVMe接口相关的存储加速,和面向虚拟化网络的智能网卡方案。同时在参与CCIX,Gen-Z,OpenCAPI缓存一致性总线的协议推广工作。



吴忠杰



报告题目:重新定义存储软硬件边界,升级云计算存储平台


演讲摘要:近年来,存储介质技术发生了翻天覆地的变化,围绕NAND Flash以及非易失性内存介质的半导体存储技术得到了飞速发展,开始逐步替代传统的磁盘存储技术。存储介质发展的同时,推动了网络互连技术的演进。为了破解网络互连的性能瓶颈,高性能物理网络以及新型网络传输协议被提上日程,RoCE RDMA技术已经开始被规模化应用到云计算数据中心。但是,存储软硬件技术高速发展的同时,传统软硬件边界和接口慢慢变成了技术演进的一个问题。未来的数据中心SSD会定义成什么样,如何与存储软件进行协同?未来的网络硬件需要长成什么样,如何与存储软件进行分工协作?需要从系统设计的角度对其进行重新定义与优化,形成更加合理的软硬件边界与接口,形成下一代数据中心通用硬件。在通用硬件的基础之上,配合软件实现规模化的数据中心存储服务。本次报告结合阿里巴巴存储系统设计,分享数据中心存储系统设计面临的问题,重新定义存储软硬件边界,升级云计算存储平台。


嘉宾简介:吴忠杰(Alan Wu),阿里巴巴资深技术专家,花名储道,长期从事存储技术研究与开发,撰写《存储之道》技术博客。本、硕毕业于吉林大学,曾经在中科院计算所担任存储虚拟化团队课题组长,负责存储虚拟化技术的研发;在EMC担任Tech Leader,负责备份存储卷管理与数据保护,提出新一代基于细粒度CHUNK进行数据保护的方法;在Memblaze创立并负责存储事业部,担任高级总监,提出并设计实现闪存存储系统,推动闪存存储产业化。



论坛主席



蒋德钧

主席简介:博士,中科院计算所副研究员,主要研究兴趣包括存储系统,操作系统,分布式系统,云计算等。在ATC,PACT,HotStorage, WWW,TACO等国际会议/期刊上发表论文十余篇。承担或参与科技部重点研发计划项目,国家自然科学基金项目,973、863项目子课题。在北京航空航天大学获得学士学位,在清华大学获得硕士学位,在荷兰Vrije Universiteit获得计算机科学博士学位。


吴忠杰

共同主席简介:阿里巴巴资深技术专家,长期从事存储技术研究与开发,撰写《存储之道》技术博客。本、硕毕业于吉林大学,曾经在中科院计算所担任存储虚拟化团队课题组长,负责存储虚拟化技术的研发;在EMC担任Tech Leader,负责备份存储卷管理与数据保护,提出新一代基于细粒度CHUNK进行数据保护的方法;在Memblaze创立并负责存储事业部,担任高级总监,提出并设计实现闪存存储系统,推动产业化。



CCF推荐

【精品文章】


点击“阅读原文”,报名参会。


登录查看更多
6

相关内容

HPCC:IEEE International Conference on High Performance Computing and Communications。 Explanation:IEEE高性能计算与通信国际会议。 Publisher:IEEE。 SIT: http://dblp.uni-trier.de/db/conf/hpcc/
专知会员服务
80+阅读 · 2020年6月20日
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
37+阅读 · 2020年4月26日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
分布式智能计算系统前沿
中国计算机学会
19+阅读 · 2019年10月8日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
【CPS】CPS应用案例集
产业智能官
84+阅读 · 2019年8月9日
智能配用电大数据分析-概率性负荷预测
NE电气
5+阅读 · 2019年7月5日
CCFTF17(上海):认知计算产业化如何落地
中国计算机学会
4+阅读 · 2019年4月28日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
14+阅读 · 2017年5月19日
Arxiv
9+阅读 · 2019年4月19日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
8+阅读 · 2018年12月6日
Arxiv
3+阅读 · 2018年6月24日
VIP会员
相关VIP内容
相关资讯
分布式智能计算系统前沿
中国计算机学会
19+阅读 · 2019年10月8日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
【CPS】CPS应用案例集
产业智能官
84+阅读 · 2019年8月9日
智能配用电大数据分析-概率性负荷预测
NE电气
5+阅读 · 2019年7月5日
CCFTF17(上海):认知计算产业化如何落地
中国计算机学会
4+阅读 · 2019年4月28日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
14+阅读 · 2017年5月19日
Top
微信扫码咨询专知VIP会员