报名 | 联邦学习进阶:FATE系统实践与联邦推荐算法

2020 年 3 月 20 日 机器之心
3 月 19 日,机器之心联合微众银行开设的公开课《联邦学习 FATE 入门与应用实战》 第四讲结课,VMware CTO 办公室资深研究员彭麟为大家介绍了使用 KubeFATE 部署生产环境的联邦学习 Kubernetes 集群。第四讲回顾视频:


下周,我们将迎来本系列公开课的第 5 讲和第 6 讲,详情如下:

公开课第5讲(附项目实践)


课程主题: FATE 整体架构介绍 与系统实践

课程时间: 3 月 24 日 20:00  主题演讲+项目实践+在线答疑

课程讲师: 曾纪策 微众银行人工智能部系统架构师

讲师简介: 联邦学习开源项目 FATE 工程研发负责人,曾主导业界领先的智能运维感知平台,推动人工智能在 Ops 领域的落地,加入微众前,在百度负责大规模流量分析调度系统,运维大数据平台等项目,在机器学习、大数据数据处理方面有丰富的实践经验。

课程摘要: FATE 作为一个面向生产环境的联邦学习框架,在系统架构方面,FATE 支持灵活的算法流、高弹性作业调度、分布式存储、高性能计算、跨站点传输以及高性能在线推理,包含了机器学习生命周期中诸如数据处理、模型训练、模型管理、在线推理等绝大部分功能。本次课程将介绍 FATE 整体架构、系统关键数据流以及如何实践

实践内容:
  • FATE 整体架构介绍
  • 端到端的联邦学习 Pipeline 介绍与实现

  • 高可用高性能联邦学习在线推理服务

  • 完整的机器学习生命周期实践


课前准备:
  • python2.7 环境

  • fate 代码

  • 可运行的 fate 环境,不限制版本,Standalone、Cluster 等版本均可

  • 实践部分会涉及一般命名操作



公开课第6讲


课程主题: 联邦推荐算法及其应用

课程时间: 3 月 26 日 20:00 主题讲解+在线答疑

课程讲师: 谭奔 微众银行人工智能部高级研究员

讲师简介: 博士毕业于香港科技大学,主要研究方向为迁移学习、推荐系统、机器学习等,目前在微众银行人工智能部门负责推荐算法研发工作,曾就职于腾讯,负责广告转化率预估、商品推荐等工作。在 KDD、AAAI、SDM、TIST 等国际学术期刊会议上发表论文 10 余篇,多次在国际数据挖掘大赛中名列前茅。

课程摘要: 课程主要介绍联邦推荐系统背景、联邦推荐系统分类以及现有工作、联邦推荐算法实现和联邦推荐在新闻推荐的应用。

第3课精选问答

在每期课程的 QA 环节中,有一些问题被广泛提到并且很有价值,所以我们进行了精选与编辑,供大家参考。以下为第 3 课问答精选(第 2 课主题为联邦学习 FATE 算法模块梳理及建模演示):

Q:请问稀疏数据 input 都有哪些?

我们现在主要支持的是两种,tag 和 tag:value,比如说我这个人是不是有车、有房、是男是女等等,tag:value 就是说比如说年龄:40,身高:1.6 米等等。


Q:union 是做什么?针对横向联邦吗?

不是,union 是一个单边的组件,它只是把两个组件输出的数据合并起来而已,就只干这一个事情。


Q:预测的结果在哪里看?仅 guest 方持有吗?

对,只有 guest 方持有,在纵向联邦当中是这样的。对于横向联邦,每一方都有自己的模型,一般来讲在横向的模块当中是不需要加密的,但是横向 lr 我们是提供了对 host 加密的模型计算方法。这种情况下,Host 方是拿不到这个模型的。


Q:预处理及特征工程可以介绍一下么?

目前 FATE 实现的特征工程组件包括采样、联邦特征分箱,联邦特征选择、特征归一化、onehot 编码等等。具体的内容,在 github 上有详细的文档介绍:https://github.com/FederatedAI/FATE/tree/master/federatedml/feature


Q:如何对数据质量进行评估?

在建模的时候,FATE 提供了一个 local_base 的组件,可以使用本地的数据建模,从而和联邦以后的建模效果进行比对。除此以外,还可以看看交集的数量,求对方特征的 iv 值进行比较等等方式。


Q:如果没有同态加密的,联邦和分布式有什么区别?

这个区别还是挺大的。分布式是你自己的的集群,你自己可以随便访问数据,但联邦学习即使没有用到同态加密,比如说只用了安全聚合的方式,你也是 access 不到别人的数据的,对于 arbiter 来说,只能得到最终所有模型聚合的和。


第 4 课的问答精选正在整理中,详情请关注公开课专栏更新,点击 阅读原文 即可跳转。

如何加入

添加机器之心小助手(syncedai6),备注FATE,加入《联邦学习FATE入门与应用实战》课程学习。主题讲解、项目实践、在线答疑,联邦学习从零入门。

登录查看更多
3

相关内容

联邦学习(Federated Learning)是一种新兴的人工智能基础技术,在 2016 年由谷歌最先提出,原本用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。其中,联邦学习可使用的机器学习算法不局限于神经网络,还包括随机森林等重要算法。联邦学习有望成为下一代人工智能协同算法和协作网络的基础。
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
131+阅读 · 2020年3月25日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
198+阅读 · 2020年2月11日
【课程】概率图模型,卡内基梅隆大学邢波
专知会员服务
69+阅读 · 2019年11月4日
3个可以写进简历的京东NLP项目实战
专知
11+阅读 · 2020年6月4日
杨强教授:AI算法重点转向关注数据安全隐私
极市平台
11+阅读 · 2019年2月17日
实战深度学习,我们给你整了6个杀手级项目
七月在线实验室
7+阅读 · 2018年3月27日
报名 | 知识图谱前沿技术课程(苏州大学站)
PaperWeekly
12+阅读 · 2017年11月27日
博士团队带您入门机器学习,课程大优惠,限额30人,赶快上车啦!!!
报名 | 知识图谱前沿技术课程(暨学术交流)
PaperWeekly
17+阅读 · 2017年7月10日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
Weight Poisoning Attacks on Pre-trained Models
Arxiv
5+阅读 · 2020年4月14日
Arxiv
29+阅读 · 2020年3月16日
Arxiv
23+阅读 · 2018年8月3日
Arxiv
6+阅读 · 2018年5月18日
Arxiv
3+阅读 · 2018年3月2日
Arxiv
6+阅读 · 2017年12月2日
VIP会员
相关资讯
3个可以写进简历的京东NLP项目实战
专知
11+阅读 · 2020年6月4日
杨强教授:AI算法重点转向关注数据安全隐私
极市平台
11+阅读 · 2019年2月17日
实战深度学习,我们给你整了6个杀手级项目
七月在线实验室
7+阅读 · 2018年3月27日
报名 | 知识图谱前沿技术课程(苏州大学站)
PaperWeekly
12+阅读 · 2017年11月27日
博士团队带您入门机器学习,课程大优惠,限额30人,赶快上车啦!!!
报名 | 知识图谱前沿技术课程(暨学术交流)
PaperWeekly
17+阅读 · 2017年7月10日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
Top
微信扫码咨询专知VIP会员