【机器学习】机器学习奠基人Michael Jordan:下代技术是融合经济学,解读2项重要进展(含PPT)

2019 年 12 月 11 日 产业智能官

北京智源人工智能研究院




2019年11月1日北京智源大会全体大会及闭幕式上,被誉为“机器学习之父”的加州大学伯克利教授、智源研究院学术顾问委员会委员 Michael I.Jordan 做了题为《决策与情境:基于梯度的博弈均衡求解方法》(Decisions and Contexts: On Gradient-Based Methods for FindingGame-Theoretic Equilibria)的主题演讲。


这个演讲报告既“高屋建瓴”,Michael I.Jordan 将机器学习的前世今生划分为四个时代,指出正在到来的第四代机器学习,实践层面将是与智能市场系统的融合,理论层面将是机器学习与经济学等的融合;同时也“脚踏实地”,Michael I.Jordan 介绍了一系列他们在第四代机器学习视角下的研究进展,包括鞍点逃逸、算法加速以及基于博弈均衡机制的“多臂赌博机”等。

 

下面是关于Michael I.Jordan演讲的精彩要点介绍。

 



机器学习的四个时代



首先作为“机器学习之父”,Michael I.Jordan 以化学工程、电器工程的历史发展作为参照案例,来解读他理解中的机器学习。在上世纪20、30年代前,世上还没有“化学工程”这门学科,那时候的化学学科,仅仅是关于实验室里用试剂做实验的内容。直到后来伴随着量子科学的发展、化学工厂以及相关产品的涌现,才出现了化学工程。


电气工程学的前身是一些电子公式,但无法回答研发电路以及实现城市电气化等问题,随着人们开始思考抗阻模块、线路等,便诞生了电子工程学。

 

Michael I.Jordan 认为机器学习的发展,遵循着和上面两种学科类似的理论和实践结合路径:它将传统的统计、算法和推理整合在一起,同时也是工程学的拓展,涉及了人类决策、数据分析等方面的设计和系统应用,它的目标并不是取代人类,也不仅仅是人工智能,而是将人和机器系统融合在一起,包括它将整合包括统计学家、计算机科学家以及经济学家等各类人才的聪明才智,来应对、解决来自社会层面的各种挑战。

 

具体来说,机器学习自诞生后的几十年里鲜有突破,主要涉及数据分析和人类决策,而自上世纪90年代后,机器学习的历史发展可划分为如下四个时代。

 

第一代机器学习(1990~2000年):主要应用是欺诈检测、检索和供应链管理等。欺诈检测主要是应用于电商领域,通过机器学习来鉴别、降低诈骗。比如当时在亚马逊的信用卡诈骗率曾一度是1%-3%,因此亚马逊开始使用云计算机系统,结合数据及不同算法,比如随机森林(Random Forests,简称RF),使诈骗率降到1%以下。之后,亚马逊开始在整个供应链和物流上利用机器学习进行建模,因为在跨境运输条件下,一条有效的供应链,能保证产品即使在面临台风的情况下依然能准时准确送达,这便需要大量的数据分析及各种测算。

 

第二代机器学习(2000~2010年):开始涉及人类层面的研究,以推荐系统、社交媒介系统等为代表。这个阶段,我们拥有的大数据,不仅仅涉及如跨洋运输供应链等产品层面的信息,也内嵌了可供分析“消费者购买原因”的数据内容。比如两个人购买了同一本书,我们基于此进行分析,然后将这本书推荐给另一个还没有购买的潜在客户。于是推荐系统的研究,带来了巨大的行业影响,比如阿里巴巴、亚马逊等都采用了这样的机器学习应用,并进一步发展了价值几十亿资产的行业。

 

第三代机器学习(2010年至今):模式识别应用,以语音识别、计算机视觉、机器翻译等为代表。此时,我们可以模拟人类的智能,或者说可以模仿人类某一方面的智能。我们主要通过数据分析来进一步分析人类智能,但并不意味着现在计算机能够捕捉所有的人类思考。计算机还需要很久的时间才能像人类一样聪明。

 

第四代机器学习(正在到来):机器学习融合市场。市场相当于一种去中心化的算法系统,将消费者和商品紧密连接,把人、数据和现实中的问题和需求进行整合,成为一个可以创建经济新业态的平台,比如Uber,中国的滴滴等。这些市场算法系统和宏观经济的一些原则相类似,必须借助大数据分析,并扩大应用规模,这样才能产生更大的效果;这个市场系统可以在不同的尺度、规模下运作,适应性强,可长时间运行,用户可以自由下载进入的软件。当然这些环节中,计算机并没有代替人类,而是作为整个系统的一个总控。


Michael I.Jordan认为,迄今为止机器学习构建智能市场系统的使命远未完成,包括还没有实现将机器学习和经济学(包括经济统计学、经济测量学等)紧密结合在一起。

 

 


第四代机器学习中的研究进展



Michael I.Jordan 近十年来主要从事于“第四代机器学习”中决策方向的相关研究,包括创造市场的统计系统、分散决策的错误控制、管理边缘云端交互等。(如下图)



第四代机器学习研究问题范例


 

他关于决策问题的一个重要论断是,机器学习必须要考虑“因果关系”,只有这样才有可能进行大规模的工程应用,比如无人驾驶决定是否加速或停止,这不仅仅是一个阈值和输出的问题,而是要综合考虑周围汽车、街道状况后才能做出决定。

 

接下来,Michael I.Jordan介绍了他们团队最近取得的两项重要研究进展。

 

第一项研究是关于如何有效避开鞍点的问题。鞍点是深度学习中非常棘手、大量存在的问题,它会导致学习曲线变平。我们经常会看到一个学习曲线下降很快,之后很久都是平的,这便是鞍点的表现,尽管它最终会脱离鞍点继续下降,但在现实实践中,我们往往要处理高维下降到低维问题,此时会遇到十多万甚至上百万的维度干扰路径选择,用传统的梯度下降法来逃离鞍点,会十分耗费时间。


因此 Michael I.Jordan 团队在成员 Chi Jin 的主持研究下,提出了一个高效率摆脱鞍点的方案。MichaelI.Jordan 介绍说:“我们引入海森-利普希茨性质(如下图),很明显二阶驻点是一阶驻点的扩展,这个梯度同样趋近零且不等于零,同时海森矩阵的最小特征值不严格大于等于零。我们给自己放松了一个小区间,可得到了一个收敛速度,所以可以测试达到二阶驻点速度有多快。这个算法被命名为扰动梯度下降,本质是在一般梯度下降算法的情况下偶尔增加一些随机噪音。




扰动梯度下降算法原理


关于这个算法背后的几何原理(如下图):鞍点周围相当于是一个饼状区域,我们如果进入这个区域会被困在里面,在鞍点上停留很长时间,这时候如果有一些随机扰动会把我们从鞍点区域踢出去,以确保不会一而再再而三地陷入困境,这个理论就是关于如何高效率地远离这个饼状区域。




  扰动梯度下降算法的几何图解

 

第二项研究进展是关于加速算法,了解加速时会发生的状况及最快运行速度。同时 MichaelI.Jordan 认为在一个离散的点上,更快并没有太大意义,而是要根据整个持续的连续体来看究竟能多快。MichaelI.Jordan 的两个学生花了三年时间研究出通过变分、哈密顿和辛集成的视角来做加速。首先,他们发现如下图最下面的两个公式可以比传统方式运行得更快。




梯度下降的加速算法

 

后来发现拉格朗日函数(如下图),优化一下便能实现最快速度,这是目前能实现的最好结果。函数中有一个布雷格曼散度(Bregman Divergence),它依赖于速度,这个公式孕育出很多加速算法。Michael I.Jordan 团队还发现,布雷格曼拉格朗日函数(Bregman Lagrangian)在几何学方面具有很好的一致性,这意味着不管用什么速度,都可以在一个持续时间当中来实现这个速度,但假如把持续时间和不同公式输入到电脑中逆转推算,却无法实现。




布雷格曼拉格朗日函数

 

接下来是辛集成(Symplectic Integration)(如下图),它是目前最好的算法,也很稳定。我们可以用特殊方式进行加速,利用拉格朗日函数、汉密尔顿函数进行表征,来解决其他许多问题。




辛集成

 

目前在加速和鞍点方面的问题中,Michael I.Jordan团队做了进一步的研究,尝试用汉密尔顿函数分析(如下图)的方式来解决,就是先把汉密尔顿函数分解,分别研究,然后再组合到一起,得到一个综合分析。




汉密尔顿函数分析


下面的加速算法(如下图),是针对一个非凸点问题的,它可以跟汉密尔顿函数相结合,或许能验证加速、帮助通过鞍点。




针对非凸点问题的算法加速

 



未来十年的研究方向:

市场与科学、决策的整合闭环



展望未来十年的研究方向,Michael I.Jordan 表示,他们将专注于科学和数学,将市场与科学、市场与决策整合,建立一个闭环链条。


Michael I.Jordan 团队目前正在实验中的一个项目,叫多臂赌博机(Multi-Armed Bandits),这种赌博机的游戏规则简单来讲就是:假设有A到K的选项,选择一个选项后得到奖励,之后进一步增加得分,把得分最大化。这个项目中的成果已经在AB测试、药品研发等诸多领域中应用,它内蕴的博弈逻辑,实际上已经渗透到现在的市场经济各种现象之中。


按 Michael I.Jordan 的观点,对于一个有买方、卖方的匹配市场,就会存在供需匹配和排序的问题,比如很多人选择同一家餐厅,便需要对空间进行限制,比如两人选择了同样的座位,后来者就像AB测试那样输掉,当然输者就会后悔自己的决策。为此,Michael I.Jordan团队已经在建立一个名叫 Bandit Markets 的数学理论,用以验证算法、降低后悔量。这个算法叫做 Gale-Shapley。

 

最后,回归到决策问题,Michael I.Jordan 介绍了他们在算法上的一个最新进展。从统计学的角度来说决策问题,好比这张二乘二表中(如下图)中0和1的假设,如何测量决策成功呢?如果现实是1,实现预测也是1,或者规避现实是0、预测是1的情况,传统的方式就对专一性和高敏感度进行优化,但这种方式当数据集里发现项假的比较多时,很难有好的效果。

 



二乘二表模拟决策

 

因此 Michael I.Jordan 团队提出了贝叶斯过滤算法来控制的方案(如下图),这个算法公式可以用来展示假的发现项。




贝叶斯算法的过滤方案

 

以上是 Michael I.Jordan 团队用机器学习结合统计学、市场决策等,在推进第四代机器学习时代的过程中,近年来所取得的一些研究进展。Michael I.Jordan 作为机器学习领域的泰斗级人物,其历史和行业视野的前瞻性洞察和研究工作的细致入微的紧密结合,透过这场报告呈现得淋漓尽致,相信能给我们人工智能领域科研者、从业者们带来不少有益的启发。


先进制造业+工业互联网




产业智能官  AI-CPS


加入知识星球“产业智能研究院”:先进制造业OT(自动化+机器人+工艺+精益)和工业互联网IT(云计算+大数据+物联网+区块链+人工智能)产业智能化技术深度融合,在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的产业智能化平台;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。


产业智能化平台作为第四次工业革命的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎; 重构设计、生产、物流、服务等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生 新技术、新产品、新产业、新业态和新模式; 引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。

产业智能化技术分支用来的今天,制造业者必须了解如何将“智能技术”全面渗入整个公司、产品、业务等商业场景中, 利用工业互联网形成数字化、网络化和智能化力量,实现行业的重新布局、企业的重新构建和焕然新生。

版权声明产业智能官(ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:erp_vip@hotmail.com。




登录查看更多
3

相关内容

在数学中,鞍点或极大极小点是函数图形表面上的一点,其正交方向上的斜率(导数)都为零,但它不是函数的局部极值。鞍点是在某一轴向(峰值之间)有一个相对最小的临界点,在交叉轴上有一个相对最大的临界点。
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
126+阅读 · 2020年7月10日
【硬核课】统计学习理论,321页ppt
专知会员服务
135+阅读 · 2020年6月30日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
专知会员服务
121+阅读 · 2020年3月26日
专知会员服务
109+阅读 · 2020年3月20日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
38+阅读 · 2019年10月16日
分布式智能计算系统前沿
中国计算机学会
18+阅读 · 2019年10月8日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
清华朱军教授:机器学习未来的几大挑战与目前进展
DeepTech深科技
4+阅读 · 2018年10月29日
NYU陈溪博士:运筹学与机器学习的融合交叉
AI科技评论
6+阅读 · 2018年7月21日
贝叶斯机器学习前沿进展
架构文摘
12+阅读 · 2018年2月11日
CFP——数据挖掘前沿进展
计算机研究与发展
5+阅读 · 2018年1月12日
独家 | Michael I. Jordan最新清华授课笔记!
THU数据派
4+阅读 · 2017年9月17日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
Arxiv
22+阅读 · 2019年11月24日
A General and Adaptive Robust Loss Function
Arxiv
7+阅读 · 2018年11月5日
Mobile big data analysis with machine learning
Arxiv
6+阅读 · 2018年8月2日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
15+阅读 · 2018年4月3日
Arxiv
3+阅读 · 2018年3月28日
VIP会员
相关VIP内容
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
126+阅读 · 2020年7月10日
【硬核课】统计学习理论,321页ppt
专知会员服务
135+阅读 · 2020年6月30日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
专知会员服务
121+阅读 · 2020年3月26日
专知会员服务
109+阅读 · 2020年3月20日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
相关资讯
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
38+阅读 · 2019年10月16日
分布式智能计算系统前沿
中国计算机学会
18+阅读 · 2019年10月8日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
清华朱军教授:机器学习未来的几大挑战与目前进展
DeepTech深科技
4+阅读 · 2018年10月29日
NYU陈溪博士:运筹学与机器学习的融合交叉
AI科技评论
6+阅读 · 2018年7月21日
贝叶斯机器学习前沿进展
架构文摘
12+阅读 · 2018年2月11日
CFP——数据挖掘前沿进展
计算机研究与发展
5+阅读 · 2018年1月12日
独家 | Michael I. Jordan最新清华授课笔记!
THU数据派
4+阅读 · 2017年9月17日
相关论文
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
Arxiv
22+阅读 · 2019年11月24日
A General and Adaptive Robust Loss Function
Arxiv
7+阅读 · 2018年11月5日
Mobile big data analysis with machine learning
Arxiv
6+阅读 · 2018年8月2日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
15+阅读 · 2018年4月3日
Arxiv
3+阅读 · 2018年3月28日
Top
微信扫码咨询专知VIP会员