首部全面、系统的联邦学习专著,杨强教授领衔撰写,《联邦学习》教你打破数据孤岛(赠书)

2020 年 5 月 14 日 机器之心

机器之心报道

参与:张倩

终于,「联邦学习」也有专著看了。


最近一段时间,某银行向「大客户」泄露用户银行流水的新闻引发了热烈讨论。对此,央视新闻点评道,「别把用户信息扔出池子」。「如果轻易将用户信息扔出池子,那任何企业和机构都『中看不中用』,势必丢掉广大用户,也要受到法律惩处」。


要做到「不把用户信息扔出池子」,除了需要依靠银行等部门严格遵守规定,还需要技术的加持。近几年兴起的联邦学习就是基于这个目标提出的。

联邦学习也叫联邦机器学习。数据是机器学习的基础。而在大多数行业中,由于行业竞争、隐私安全、行政手续复杂等问题,数据常常是以孤岛的形式存在的。即使是在同一个公司的不同部门之间,实现数据集中整合也面临着重重阻力。在现实中想要将分散在各地、各个机构的数据进行整合几乎是不可能的,所需的成本也是巨大的。

同时,各国都在加强对数据安全和隐私的保护,欧盟最近引入的新法案《通用数据保护条例》(GDPR) 表明,对用户数据隐私和安全管理的日趋严格将是世界趋势。

针对数据孤岛和隐私安全这两大问题,谷歌和微众银行分别提出了不同的联邦学习框架,而后者的背后就是微众银行首席人工智能官、香港科技大学计算机科学与工程系讲席教授杨强带领的团队。

联邦学习是多个数据拥有方组成一个联盟,共同参与全局模型的训练。各参与方之间在保护数据隐私和模型参数的基础上,仅共享加密的模型参数或者加密的中间计算结果,而无原始数据共享,让数据可用不可见,且联合构建的模型可以达到更优的模型性能。

随着数据安全方面的法律、法规不断完善,越来越多的公司、机构将隐私安全提上了日程,也有越来越多的研究者投身其中。那么,对于那些想要入门联邦学习的研究者来说,有什么系统的资料可以参考呢?

最近,杨强教授领衔出版了一本专著——《联邦学习》,这是首部全面、系统论述联邦学习理论、算法、平台及应用的中文专著。


这本书剖析了联邦学习与数据安全、隐私保护的前沿学术成果,内容涵盖隐私保护技术,联邦学习定义、分类、算法和系统,联邦学习激励机制等。此外,作者还论述了联邦学习在计算机视觉、自然语言处理和推荐系统等领域的应用,以及如何解决用户隐私、数据安全及联邦学习应用落地问题。

这本书可以作为计算机科学、人工智能和机器学习专业的学生,以及大数据和人工智能应用程序开发人员的入门参考书,也可供本科高年级学生或者研究生、大学的教员和研究机构的研究人员阅读。

杨强:国际「迁移学习」与「联邦学习」带头人

杨强教授是微众银行的首席人工智能官和香港科技大学计算机科学与工程系讲席教授。他的研究兴趣包括人工智能、机器学习和数据挖掘,特别是迁移学习、自动规划、联邦学习和基于案例的推理。

他是人工智能领域「迁移学习」、「联邦学习」的发起人及带头人之一,迄今共发表人工智能和数据挖掘方面的论文数百篇。

2013 年 7 月,杨强当选为 AAAI 院士,是首位获此殊荣的华人。2016 年 5 月,他又当选为 AAAI 执行委员会委员,也是首位出任该职位的华人。

在 1 月 11 日清华大学发布的「AI 全球最具影响力学者榜单」中,杨强与何恺明成为人工智能学科子领域 Top1 顶尖学者中仅有的两位华人学者,其中杨强教授入选的是经典 AI(AAAI/IJCAI)领域。

2018 年,杨强教授出任微众银行首席人工智能官(CAIO),带领微众银行 AI 团队开源了全球首个工业级的「联邦学习」技术框架 Federated AI Technology Enabler(FATE),并牵头推动联邦学习 IEEE 国际标准的制定。


今年 1 月初,杨强教授还当选为 AAAI 2021 大会的主席,成为 AAAI 大会历史上第二位大会主席,也是当选此职位的首位华人。

除了杨强教授之外,参与本书撰写的还包括微众银行 AI 部门的高级研究员刘洋、程勇、康焱,微众银行 AI 部门的副总经理陈天健,新加坡南洋理工大学计算机科学与工程学院助理教授、微众银行特聘顾问于涵 5 人。他们都参与了联邦智能使能器(Federated AI Technology Enabler,FATE)的联邦学习平台的开发。书中的许多思想来源于这个实践,因此具有实用性。

新书大纲

中国科学院院士、清华大学人工智能研究院院长张钹在书的序言中描述了本书的结构:

从广度上看,书中讨论了四种联邦学习的基本类型,即横向联邦学习、纵向联邦学习、联邦迁移学习和联邦强化学习,还讨论了相关的联邦学习激励机制和分布式机器学习。从深度上看,书中包括原理、算法、平台和应用实例。

具体来说,这本书共分为 11 个章节,分别是:

  • 引言

  • 隐私、安全及机器学习

  • 分布式机器学习

  • 横向联邦学习

  • 纵向联邦学习

  • 联邦迁移学习

  • 联邦学习激励机制

  • 联邦学习与计算机视觉、自然语言处理及推荐系统

  • 联邦强化学习

  • 应用前景

  • 总结与展望


书的具体目录可以点击「阅读原文」查看。

赠书

为了满足读者的求知欲,机器之心联合电子工业出版社博文视点向读者赠送 20 本 《联邦学习》。读者可以在留言区 写下自己对于联邦学习的理解或学习动机 ,获赞最多的前20名读者将获赠此书。

没有被抽到的读者可以点击「阅读原文」自行购买。


文为机器之心报道,转载请联系本公众号获得授权
✄------------------------------------------------
加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com
投稿或寻求报道:content @jiqizhixin.com
广告 & 商务合作:bd@jiqizhixin.com
登录查看更多
14

相关内容

联邦学习(Federated Learning)是一种新兴的人工智能基础技术,在 2016 年由谷歌最先提出,原本用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。其中,联邦学习可使用的机器学习算法不局限于神经网络,还包括随机森林等重要算法。联邦学习有望成为下一代人工智能协同算法和协作网络的基础。
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
131+阅读 · 2020年3月25日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
破解数据孤岛壁垒,三篇论文详细解读联邦学习
AI科技评论
24+阅读 · 2019年5月7日
联邦学习或将助力IoT走出“数据孤岛”?
中国计算机学会
20+阅读 · 2019年3月16日
“联邦学习”实现“共同富裕”?来TF“共同富裕”!
中国计算机学会
5+阅读 · 2019年3月12日
杨强教授:AI算法重点转向关注数据安全隐私
极市平台
11+阅读 · 2019年2月17日
CCCF专栏 | 联邦学习
中国计算机学会
26+阅读 · 2018年11月19日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
8+阅读 · 2018年2月23日
Arxiv
3+阅读 · 2017年8月15日
VIP会员
相关资讯
破解数据孤岛壁垒,三篇论文详细解读联邦学习
AI科技评论
24+阅读 · 2019年5月7日
联邦学习或将助力IoT走出“数据孤岛”?
中国计算机学会
20+阅读 · 2019年3月16日
“联邦学习”实现“共同富裕”?来TF“共同富裕”!
中国计算机学会
5+阅读 · 2019年3月12日
杨强教授:AI算法重点转向关注数据安全隐私
极市平台
11+阅读 · 2019年2月17日
CCCF专栏 | 联邦学习
中国计算机学会
26+阅读 · 2018年11月19日
Top
微信扫码咨询专知VIP会员