CAA | 平行学习——一个新的机器学习理论框架

2017 年 8 月 31 日 中国自动化学会

平行学习——一个新的机器学习理论框架


李 力 林懿伦 郑南宁 王飞跃


       随着计算能力的提高和计算理论的创新机器学习在过去 30 年中取得了长足的发展正受到越来越多人的关注。与此同时机器学习也面临越来越多的问题 传统机器学习理论框架的不足被逐渐发现和确认新的机器学习理论框架不断被提出。

      中国科学院自动化研究所王飞跃研究员于2004年提出了平行系统的思想[1]试图用一种适合复杂系统的计算理论与方法解决社会经济系统中的重要问题。其主要观点是利用大型计算模拟、预测并诱发引导复杂系统现象通过整合人工社会计算实验和平行系统等方法形成新的计算研究体系。平行的核心思想是从“小数据”中产生“大数据”再从“大数据”中提炼“小规则”即精准知识。这一思想也应是机器学习的主旨。

       近年来, 我们尝试将平行系统的思想扩展并引入到机器学习领域以建立一种新型理论框架更好地解决数据取舍、行动选择等传统机器学习理论不能很好解决的问题。在本文中,我们将对这一理论框架的结构和方法进行阐述。框架示意图如下:

图1  平行学习的理论框架

    平行学习[2-3]大致可以分为描述学习(Descriptive learning)、预测学习(Predictive Learning)、指示学习(Prescriptive Learning)三个互相耦合关联的阶段。

       在数据处理阶段平行学习首先从原始数据中选取特定的“小数据”结合先验知识使用描述学习产生一个人工系统。 结合特定的原始小数据与人工系统使用预测学习的方法产生大量的新数据构成了解决问题所需要的“大数据”。

      在行动学习阶段平行学习沿用强化学习的思路使用状态迁移来刻画系统的动态变化通过指示学习的方式在人工系统中对行动空间进行探索。通过学习提取我们可以得到“小知识”——应用于某些具体场景或任务的精准知识并将其应用于平行控制和平行决策。而平行控制和平行决策将引导系统进行特定的数据采集获得新的原始数据并再次进行新的平行学习使系统在数据和行动之间构成一个闭环。

       以平行学习在自动泊车中的应用为例[4]。首先通过获取真实系统中的泊车数据结合计算实验与预测学习生成人工数据形成泊车的“大数据”。使用这些数据学习构造一个人工系统该系统平行于真实的泊车系统接受控制序列作为输入输出车辆的移动轨迹。在这一人工系统中我们可以使用指示学习的方式探索可能的泊车方案学习到的策略会控制真实车辆进行泊车进而获得更多的数据。完整流程如下:

图2  平行学习在自动泊车中的应用

       平行学习已在虚拟场景生成[5]、无人驾驶车辆的智能控制与测试[6]、社会计算和情报处理[7]等领域得到了较好的应用。期待本文抛砖引玉引起业内专家学者兴趣共同对机器学习理论做出更加深入的革新。

参考文献

[1] 王飞跃. 人工社会, 计算实验, 平行系统-关于复杂社会经济系统计算研究的讨论. 复杂系统与复杂性科学, 2004, 1(4): 25-35.

[2] L. Li, Y.-L. Lin, N.-N. Zhang, and F.-Y. Wang, Parallel learning: a perspective and a framework, IEEE/CAA Journal of Automatica Sinica, vol. 4, no. 3, pp. 389–395, July 2017.

[3] 李力, 林懿伦, 曹东璞, 郑南宁, 王飞跃. 平行学习——机器学习的一个新型理论框架. 自动化学报, 2017, 43(1): 1-8.

[4] Y.-L. Lin, L. Li, X.-Y. Dai, N.-N. Zheng, and F.-Y. Wang, Master general parking skill via deep learning, Proceedings of IEEE Intelligent Vehicle Symposium, 2017.

[5] K.-F. Wang, C. Gou, N.-N. Zheng, J. M. Rehg, and F.-Y. Wang, Parallel vision for perception and understanding of complex scenes: methods, framework, and perspectives, Artificial Intelligent Review, vol.48, no.3, pp.298-328, Oct. 2017.

[6] W. Liu, Z.-H. Li, L. Li, and F.-Y. Wang, Parking like a human: a direct trajectory planning solution, IEEE Transactions on Intelligent Transportation Systems, no. 99, pp. 1−10, Apr. 2017.

[7] F.-Y. Wang, Toward a paradigm shift in social computing: The ACP approach, IEEE Intelligent Systems, vol.22, no.5, pp.65−67, Sept.-Oct. 2007.

作者简介

李力 清华大学自动化系副教授. 主要研究方向为人工智能和机器学习, 智能交通系统和智能汽车. E-mail: li-li@tsinghua.edu.cn

林懿伦 中国科学院自动化研究所复杂系统管理与控制国家重点实验室博士研究生. 主要研究方向为社会计算,智能交通系统, 智能汽车, 深度学习和强化学习. E-mail: linyilun2014@ia.ac.cn

郑南宁 西安交通大学人工智能与机器人研究所教授.中国工程院院士.主要研究方向为模式识别与智能系统,机器视觉与图象处理. Email:nnzheng@mail.xjtu.edu.cn

王飞跃 中国科学院自动化研究所复杂系统管理与控制国家重点实验室研究员.  国防科学技术大学军事计算实验与平行系统技术研究中心主任. 主要研究方向为智能系统和复杂系统的建模、分析与控制. 本文通信作者. E-mail: feiyue.wang@ia.ac.cn



来源:JAS自动化学报英文版

登录查看更多
0

相关内容

【斯坦福CS520】向量空间中嵌入的知识图谱推理,48页ppt
专知会员服务
99+阅读 · 2020年6月11日
【开放书】SLAM 中的几何与学习方法,62页pdf
专知会员服务
107+阅读 · 2020年6月5日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
82+阅读 · 2020年5月2日
《强化学习》简介小册,24页pdf
专知会员服务
263+阅读 · 2020年4月19日
知识图谱融合方法,140页ppt,南京大学胡伟老师
专知会员服务
137+阅读 · 2020年2月19日
【机器学习课程】机器学习中的常识性问题
专知会员服务
72+阅读 · 2019年12月2日
【学界】生成式对抗网络:从生成数据到创造智能
GAN生成式对抗网络
6+阅读 · 2018年6月14日
【学界】基于平行视觉的特定场景下行人检测
GAN生成式对抗网络
6+阅读 · 2018年1月15日
荐书丨机器学习——Python实践(留言送书)
程序人生
7+阅读 · 2018年1月5日
超级干货 :一文读懂集成学习(附学习资源)
数据分析
9+阅读 · 2017年10月30日
【平行讲坛】平行图像:图像生成的一个新型理论框架
GAN生成式对抗网络
4+阅读 · 2017年9月15日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Arxiv
20+阅读 · 2019年9月7日
A General and Adaptive Robust Loss Function
Arxiv
7+阅读 · 2018年11月5日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
VIP会员
相关VIP内容
【斯坦福CS520】向量空间中嵌入的知识图谱推理,48页ppt
专知会员服务
99+阅读 · 2020年6月11日
【开放书】SLAM 中的几何与学习方法,62页pdf
专知会员服务
107+阅读 · 2020年6月5日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
82+阅读 · 2020年5月2日
《强化学习》简介小册,24页pdf
专知会员服务
263+阅读 · 2020年4月19日
知识图谱融合方法,140页ppt,南京大学胡伟老师
专知会员服务
137+阅读 · 2020年2月19日
【机器学习课程】机器学习中的常识性问题
专知会员服务
72+阅读 · 2019年12月2日
Top
微信扫码咨询专知VIP会员