徐宗本：人工智能的基石是数学

会员服务 ·

徐宗本：人工智能的基石是数学

2019 年 10 月 21 日 算法与数学之美

徐宗本院士在做主题报告

“人工智能的基石是数学，没有数学基础科学的支持，人工智能很难行稳至远。” 在中国科学院院士、西安交通大学教授徐宗本看来，目前人工智能所面临的一些基础问题，其本质是来自数学的挑战。

近日，由联合国教科文组织和中国工程院联合主办的以“大数据与知识服务”为主题的联合国教科文组织国际工程科技知识中心2019国际高端研讨会上，徐宗本在题为《AI与数学：融通共进》的主题报告上如是说。

数学家眼里的人工智能是什么？

徐宗本给出的答案简洁明了：当下主要指机器学习。

如果给这个名词赋予一个说明，他认为这是人或者智能体，通过与环境的交互来提升自身行为和解决问题能力的智能化操作。“机器学习是把这种智能形式化为数学公式，转换成计算机可以操作的算法和软件。”

进一步说，人工智能实际上是一个将数学、算法理论和工程实践紧密结合的领域。将其扒开来看，就是算法，也就是数学、概率论、统计学、各种数学理论的体现。

不过徐宗本认为，作为人工智能基石的数学，还存在五大核心问题待解，而这也是制约人工智能进一步发展的“绊脚石”。

第一是大数据的统计学基础

徐宗本认为，人工智能和大数据是一对孪生姐妹。人工智能更多指应用模式，强调与领域知识的结合。大数据是最底层的信息技术，強调机器和机器、机器与人之间的内容交互与理解。但是当前，分析大数据的统计学基础面临颠覆，应用于复杂大数据分析的极限理论、统计推断方法、真伪判定等数学基础都尚未完全建立起来。

第二是大数据计算基础算法

一般而言，理解和分析大数据都是通过数据处理或数据分析来实现的，而无论是数据处理还是数据分析最终都化归到求解一系列基本的数学问题，像线性方程组求解、图计算、最优化计算、高维积分等。不过，这些看似早已解决的问题在大数据情形下却成了“拦路虎”。

为此，他以旅游为例，打了一个生动的比方来解释这种挑战。“比如从西安到北京，怎么走最近？过去地图分辨率不高，根据普通的地图可以获取基本的路线。但现在大数据背景下地图的分辨率越来越高，不可能一次就给你涵盖西安至北京之间全部城市与道路的数据，只能一次一次地分别给其中某些城市之间的道路信息。如何在西安就知道到达北京需要多少时间，怎样走最近？要带多少钱？现在的机器还回答不了这些问题。这就是由于分布式图信息环境下图计算基础算法没有解决的原因。”

第三是深度学习的数学理论

徐宗本认为，这个问题在当下尤为关键。新一轮的人工智能多以深度学习为基本模型，然而深度学习的设计基础在哪？什么样的结构决定了什么样的性能？能不能有台劳公式和富里埃级数这样的数学表示理论？这些基本的理论问题还没有解决。正是这个原因，现在的人工智能还得靠“人工”来换“智能“，这也是造成当下“人工智能=人工+智能”的缘由。

第四是非常规约束下的最优输运

人工智能的很多问题都可归纳为两个领域数据打通问题，即让两个对象在满足某一个特定的不变量情况下互相转移。“比如中英文互译，它就是在保持语义的情况下将中文数据转换成英文数据。”

如果应用到现实，徐宗本畅想，将医院的CT和核磁共振图像相互转移或能很好地解决医疗诊断的信息不足问题。“因为照的是同一个人，这里人就是不变量。要解决这些问题，建立特定约束下如何实现最优传输的数学理论与方法是基本的。”

第五是关于学习方法论的建模与函数空间上的学习理论

徐宗本表示，研究生阶段学到的机器学习理论，需上升到学习方法论学习的阶段。

“从数学上说，无论函数空间上的学习理论怎么建立，本质是要适应不同的任务。由于任务本身是函数，是无穷的，那么就需要把过去机器学习中对样本、数据的选择、泛化，推广到对任务的选择、泛化上去。”

如果辩证地看待数学和人工智能的关系，相辅相成可能是其最好的诠释。徐宗本表示，不仅数学可为人工智能提供基础，人工智能也为数学研究提供新的方法论。

“比如解偏微分方程，过去人们可能会使用计算机，现在用人工智能可以做的更好。” 他认为，让数学中的模型方法与人工智能的数据方法结合，可将机器的深度学习应用得更加精明。

面对如今发展如火如荼的人工智能产业，这位院士也给出了自己对从业者的希冀。

“人工智能想要做得好，要靠数学问题尤其是算法的解决。”徐宗本再次强调，从业者应潜心从基础研究抓起，使我国的应用场景优势真正转化为技术优势和产业优势。

————

编辑 ∑Gemini

来源：科学网

☞你绝对没想过原来数学家这么流氓，一言不合就进行暴力证明

☞世界上最牛的五篇博士论文

☞数学中有哪些巧合让人眼前一亮？

☞算法立功！清华毕业教授美国被抢车，警察无能为力自己用“贪心算法”找回

☞学术史上的奇文：怎样用数学抓狮子

☞台大教授的反思：最难的一课我们却没教给学生

☞麻省理工学院(MIT)研究生学习指导—— 怎样做研究生

☞分享数学，常识和运气 ——投资大师詹姆斯·西蒙斯2010年在MIT的讲座

算法数学之美微信公众号欢迎赐稿

稿件涉及数学、物理、算法、计算机、编程等相关领域，经采用我们将奉上稿酬。

投稿邮箱：math_alg@163.com

登录查看更多

相关内容

徐宗本

关注 2

徐宗本，中国科学院院士，数学家、西安交通大学教授。主要从事智能信息处理、机器学习、数据建模基础理论研究。曾提出稀疏信息处理的L(1/2)正则化理论,为稀疏微波成像提供了重要基础；发现并证明机器学习的“徐-罗奇”定理, 解决了神经网络与模拟演化计算中的一些困难问题,为非欧氏框架下机器学习与非线性分析提供了普遍的数量推演准则; 提出基于视觉认知的数据建模新原理与新方法，形成了聚类分析、判别分析、隐变量分析等系列数据挖掘核心算法, 并广泛应用于科学与工程领域。曾获陈嘉庚信息技术科学奖、国家自然科学二等奖、国家科技进步二等奖、中国CSIAM苏步青应用数学奖、陕西省基础研究重大贡献奖；曾在2010年世界数学家大会上作45分钟特邀报告。曾任西安交通大学副校长。现任中国科学院信息技术科学部副主任、西安交通大学西安（国际）数学与数学技术研究院院长、大数据算法与分析技术国家工程实验室主任，是国家大数据专家咨询委员会委员、国家新一代人工智能战略咨询委员会委员。个人主页：http://gr.xjtu.edu.cn/web/zbxucn;jsessionid=99A690F7A24077E414B3F60A2DFEAFC4

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

专知会员服务

146+阅读 · 2020年7月3日

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

361+阅读 · 2020年6月24日

工程领域大数据和人工智能原则

专知会员服务

125+阅读 · 2020年3月26日

干货书《数据科学数学系基础》2020最新版，266页pdf

专知会员服务

322+阅读 · 2020年3月23日