朱军、张长水、林宙辰共话机器学习无人区,下一步的突破在哪里?

2019 年 6 月 13 日 大数据文摘


大数据文摘出品

记者:蒋宝尚


机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。


它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。


机器学习的发展进程决定了人工智能产品的落地的进度,那么这两年机器学习究竟有哪些进展?



6月10日,国际电气和电子工程师协会(IEEE)和国际模式识别学会(IAPR)双料会士颜水成、林宙辰教授、国内机器学习领域的青年领军人物朱军教授、清华张长水教授共聚北京,在“智源学者候选人发布暨学术报告会”上,对机器学习的最近进展以及接下来的突破方向给出了观点。


以下是圆桌会议速记,大数据文摘做了不改变原意的编辑与整理。


机器学习最近两年的进展:理论和应用兼而有之


颜水成:今天就讨论三个题目。


一、过去两年你认为机器学习最重要的进展是什么;

二、接下来的两到三年的里面在哪些方向最有可能取得突破;

三、对学生有一些什么建议。


张长水:过去两年里,机器学习或者人工智能有很多令人激动的工作,只不过可能每个人关注点不太一样。比如机器翻译,国内有个团队在做翻译的一种模式非常棒,比如说英文和德文翻译,我们传统做法就是我们准备大量的语料,训练一个模型。


这个团队考虑到了英文翻译成德文,同样的语料还可以德文翻译成英文;不仅这样,我们还可以考虑对任何一句英文没有德文对应的情况下,我们要求它翻译过去再翻译回来还是原文,对于德文来说也是这样,翻译到英文再翻译回来,这样我们就少了大量的标注数据,但是通过优化方法,加了一些目标函数约束,使得它对于数据要求只有原来的10%。


在我们实际的研究中,往往会发现很多问题,其实问题之间有很多的共性,包括数据和模型上的应用。将很多问题结合在一起,这样的工作不只是理论上分析的很漂亮,关键很使实用,就是理论和应用两者兼有之。


朱军:我认为一个比较重要的是:不确定性计算方向。在最近的数学家大会上,大家有一个观点:因为对不确定性的计算没那么重视,所以当前的机器学习很多东西都做错了。我们很多时候都在通过做预测得到结果,很少分析,比如说结果可信的程度到底是多少。所以实际从统计学上来看的话,一些统计学家会认为机器学习领域有欠缺。


但是实际上一些研究机器学习的学者有统计学背景,很多都在做这个方向,例如概算编程的框架。这从编程角度来看是比较重要的进展,就是说编程主要是用神经网络等方法在拟合的时候做不确定性计算。


未来几年,可能在应用上和实际问题结合里面是一个比较重要的时期。因为像无人驾驶,做决策等这些场景我们需要更好地刻画在位置环境里面的不确定性。所以不确定性是接下来的研究重点。


林宙辰:我个人关注理论方面,过去两年虽然大家都很关心这方面的研究也越来越多,我可以看到,大家对于这个深度学习越来越接近现实,现在不仅仅是模型,现在还没有产生,但是进展还是蛮大的,尤其是像一些理论科学家,还有一些数学家慢慢加入这个团体,他们也意识到这个深度学习构建一个环境是非常重要的一个事情。


另外,深度学习和符号计算的结合最近也显现出了苗头。虽然还很初步,但这是未来巨大的方向,你不可能全部都依靠数据来进行驱动,你要达到这种递进或者人工智能的话,必须在符号运算方面有一定的能力。


颜水成:我认为特别有三点,前面有一些经典的算法,其实是已经在那儿了,但是那些算法其实让我们真的解决问题的话,其实在本身的能力方面还有很大的欠缺。传统的一些理论上已经很完备了,深度学习的这个进步的话,真的可以解决我们觉得非常现实的这种问题,所以深度学习可能是接下来的发展重点。


勇闯研究无人区,令人瞩目的研究并非一蹴而就


第二个问题是关于机器学习无人区的。北京的学者会勇闯哪些机器学习的无人区呢?


林宙辰:我觉得还是在基础理论这个方面,还有一个大场景的应用方面,这两个方面我觉得我们后可以取得很好的成就。


朱军:这个不太好预测。


张长水:我想从突破上来说,看起来有很多的偶然性,但是我们现在回想起来,如果我们看深度神经网络这段热潮之前,很多工作都有前面的很多影子,比如说卷积层,那也不是说一蹴而就的事,很多的工作多年积累出来这样一个工作,当然我们会有几个英雄的人物,此外还有很多人不懈努力的结果。


所以我觉得比较值得高兴的是,虽然这两年都有很多热潮式、跟风式的研究,但是我们也看到有很多很踏实的研究,包括在北京,包括我们身边,其他别的科学院都有,还有一些学校,也许那些不在我们这里,但是我知道他们真的很深入地在做研究,我觉得这些都是很好的苗头。


也许过了这两年,我们没有看到哪个工作更光鲜,像一盏灯一样去带着全世界往前走,但是我们知道积累的这些工作也许会在三年以后、五年以后对我们的年轻人和学生会产生一些影响,他们的工作会上一个非常大的台阶。



实习/全职编辑记者招聘ing

加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn


志愿者介绍

后台回复志愿者”加入我们

点「在看」的人都变好看了哦
登录查看更多
2

相关内容

张长水,男,1965年生,河北人。智能技术与系统国家重点实验室学术委员会委员,清华大学自动化系教授、博士生导师, 智能技术与系统国家重点实验室副主任,自动化系主任。主要从事图像处理、信号处理、模式识别与人工智能、进化计算等研究领域以及和工业界的合作。
【纽约大学】最新《离散数学》笔记,451页pdf
专知会员服务
123+阅读 · 2020年5月26日
电力人工智能发展报告,33页ppt
专知会员服务
120+阅读 · 2019年12月25日
【机器学习课程】机器学习中的常识性问题
专知会员服务
72+阅读 · 2019年12月2日
【上海交大】半监督学习理论及其研究进展概述
专知会员服务
67+阅读 · 2019年10月18日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
清华朱军教授:机器学习未来的几大挑战与目前进展
DeepTech深科技
4+阅读 · 2018年10月29日
贝叶斯机器学习前沿进展
无人机
7+阅读 · 2018年1月26日
【机器视觉】张长水:图像识别与机器学习
产业智能官
7+阅读 · 2017年10月23日
杉山将:弱监督机器学习的研究进展 | CCAI 2017
深度学习大讲堂
4+阅读 · 2017年8月21日
观点 | 计算机视觉,路在何方
微软研究院AI头条
6+阅读 · 2017年6月21日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
Arxiv
19+阅读 · 2018年10月25日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
5+阅读 · 2018年5月5日
Arxiv
26+阅读 · 2017年12月6日
VIP会员
相关资讯
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
清华朱军教授:机器学习未来的几大挑战与目前进展
DeepTech深科技
4+阅读 · 2018年10月29日
贝叶斯机器学习前沿进展
无人机
7+阅读 · 2018年1月26日
【机器视觉】张长水:图像识别与机器学习
产业智能官
7+阅读 · 2017年10月23日
杉山将:弱监督机器学习的研究进展 | CCAI 2017
深度学习大讲堂
4+阅读 · 2017年8月21日
观点 | 计算机视觉,路在何方
微软研究院AI头条
6+阅读 · 2017年6月21日
Top
微信扫码咨询专知VIP会员