每一项技术的成熟化,必然会带来人类对技术的检视。AI 技术发展至今,亦是如此。其中数据隐私问题,更是成为众矢之的,为应对这一问题,联邦学习应运而生。2019年开始,联邦学习以一种“异军突起”的姿态成为 AI 社区最火热的研究方向和话题之一,相关的论文成果爆发式涌现,在各大 AI 会议和应用场景中都少不了它的身影。从原本的默默无闻,到炙手可热,在不少人看来,联邦学习仿佛是“一夜之间”发展起来的,然而在火爆之前,联邦学习实际上经历了长达两年的酝酿期。 1
在 AI 研究上,因为中国的起步比国外晚了那么十年,多少奠定下了我国研究机构和企业处于跟随状态的基调。然而在联邦学习的研究上,并非如此。我国不仅不再处于跟随状态,而且可以说走在国际联邦学习的技术研究、标准制定以及应用落地实践的前头。在国内,除了微众银行,还有其他企业在齐头并进地耕耘这一研究方向。正如在《中国联邦学习「五大流派」》一文中总结地那样,国内目前已主要形成联邦学习、共享智能(蚂蚁金服)、知识联邦(平安科技)、联邦智能(同盾科技)和异步联邦学习(京东数科)这五大流派。在应用方面,国内已有多家企业退出了可以进行产业落地应用的开源框架,首个便是微众银行早在2018年就开始研发、于2019年初正式开源的全球首个工业级联邦学习框架 FATE(Federated Learning Enabler)。后有百度推出PaddleFL联合学习框架聚焦深度学习在CV、NLP、推荐算法等领域的联邦学习应用、平安科技自主研发的蜂巢联邦学习平台对准金融场景中多方信息的安全协作计算、腾讯云开发出的“腾讯云数盾”以满足数据安全治理的多重需求。在具体的落地场景上,联邦学习现已在金融信贷风控、医疗AI、安防等多个场景中初具应用规模。然而除了这些行业以外,其他行业同样普遍存在数据孤岛的问题。基于此,微众 AI 团队发起了一个旨在开发和推广安全和用户隐私保护下的 AI 技术及其应用的项目「联邦学习生态」(FedAI Ecosystem),以期建立基于联邦学习的 AI 技术生态,使得各行业更充分发挥数据价值,推动垂直领域案例落地。在联邦学习生态的加持下,未来联邦学习可能能够为各行业架起一座机构与用户、机构与机构之间数据信任的桥梁,从而实现 AI 成果普惠共享的愿景。不过在这一愿景实现之前,联邦学习的研究者们以及企业参与者们还有很多的工作要做。作为中国鲜有的拥有话语权的技术研究领域,联邦学习下一步会有哪些重点方向?在应用布局方面还要突破哪些重点挑战?如何在吸引更多国内企业加入的同时也将国外企业吸纳到生态中?2020年8月7日-9日,由中国计算机学会(CCF)主办,香港中文大学(深圳)、雷锋网联合承办的第五届CCF-GAIR全球人工智能与机器人峰会,即将在深圳召开。今年,将专设「联邦学习与大数据隐私」专场,不仅邀请了联邦学习的发起人杨强教授坐镇专场,还邀请了联邦学习国内「五大流派」之一的京东数科AI实验室首席科学家薄列峰,以及腾讯安全天御金融风控负责人李超、第四范式资深机器学习架构师涂威威、创新工场南京人工智能研究院执行院长冯霁、深圳逻辑汇科技有限公司创始人丛明舒等专家,从产学研多个视角,共同深入「拆解」联邦学习!