新智元报道
来源:ae-info
编辑:雅新
近日,欧洲人文和自然科学院(Academia Europaea)正式公布新晋院士名单,共有来自世界范围内的361位学者当选。
清华大学计算机系教授孙茂松当选欧洲科学院外籍院士。
欧洲科学院是国际上跨地域和学术领域最广泛、学术地位最高、影响最大的科学组织之一 。其院士主要从欧洲各国科学院院士中选出,代表欧洲人文和自然科学界最优秀的科学精英和学术权威,其中包括74位诺贝尔奖获得者、7位图灵奖获得者、15位菲尔兹奖获得者等。
孙茂松现任清华大学计算机科学与技术系教授,清华大学学位委员会委员兼计算机学位评定分委员会主席,清华大学人工智能研究院常务副院长。
他的主要研究方向为自然语言理解、中文信息处理、Web智能和社会计算,长期以来从事这些领域的研究工作,同团队青年教师一起,指导学生在顶级国际学术会议和一流期刊上发表了一系列高水平论文,Google Scholar 引用超过 13000 次。
孙茂松教授在自然语言处理方面做出了重要贡献,特别是汉语分词和词性标注、表示学习、知识图谱、机器翻译和诗歌生成等方面。
他的研究重点之一是中文信息处理最为基础性的课题:汉语自动分词。
他研制出了一个集自动分词、词性标注、专名识别和新词识别于一体的分词标注系统CSegTag,应用于清华与欧盟近10个国家合作的欧盟第六框架计划(FP6)项目「超对等语义搜索引擎」中。
孙茂松教授的贡献和研究成果:
2012年领导完成并正式发布了文本信息处理领域两个国际标准。
2013年,孙茂松教授率领团队设计并实现了我国第一个中文大规模开放在线课程平台「学堂在线」,目前这一慕课平台在国内外具有广泛的影响,注册学习者约6000万人,注册人次约1.83亿。
2014 年,孙茂松教授作为首席科学家牵头组织了题为「面向三元空间的互联网中文信息处理理论与方法」的国家重点基础研究发展计划(973计划)项目。
2015年,由孙茂松教授带领的 THUAIPoet 团队研发的中文诗歌自动生成AI系统「九歌」。上线至今,「九歌」已累计为用户创作近1000万首诗词。这一项目在GitHub上被组织成三个系列开源,共获约3.8万星,受到了学界和业界的关注。
九歌开源代码链接:https://github.com/THUNLP-AIPoet/
2019年7月1日,清华大学人工智能研究院自然语言处理与社会人文计算研究中心正式成立,由孙茂松教授担任主任。在成立仪式上,尤政院士和张钹院士向孙茂松教授颁发了中心主任聘书。
今年5月份,清华大学孙茂松、刘知远教授的新书《知识图谱与深度学习》问世。这本书介绍了在知识图谱与深度学习方面的研究成果,对人工智能研究具有一定参考意义。
此前,在新智元重磅发布的新书《智周万物:人工智能改变中国》中,针对「2049 年人工智能未来展望」这一主题,我们邀请了人工智能领域知名学术专家和产业领袖进行讨论,接下来分享清华大学孙茂松教授对这些问题的看法。
第四次工业革命正在悄然来临,世界各国都已经认识到人工智能将是未来国家之间竞争的关键赛场。对中国而言,人工智能更是一个历史性的机遇,如果把握住,将有可能跻身 AI 强国之列。那么在接下来关键的 30 年中,中国在全球人工智能中将处于怎样的地位?中国最急需发展的 AI 子领域是什么?中国是否会拥有全球领先的 AI 企业呢?
对于 2049 年中国能否引领全球 AI 发展,孙茂松教授给出了自己的看法:
首先,我不太建议使用「引领」这个表述。我们要谦虚一点,从比较深刻的角度来看,我们还缺乏足够可资骄傲的本钱。我们还是要韬光养晦,不要锋芒毕露,动不动就试图去引领世界。我们能够和人家并驾齐驱就很不错了,应该多从构造人工智能人类命运共同体这个角度来认识和阐述。其次,钱学森先生曾把科学研究分为三个层次:基础科学、技术科学和工程技术。比如,基础科学可以对照牛顿力学,技术科学可以对照结构力学,工程技术可以对照架桥、盖房子。如果按这个标准考察国内的人工智能研究现状,目前为止我们在基础科学方面的贡献几乎找不太到,国际上人工智能相关的图灵奖得主已有10 名左右,但中国一个也没有。这是我国一个极大的短板。在技术科学方面,我们的研究成果属于上品的也乏善可陈,属于中下品的则相对多一些。当然,在工程技术方面,国内已经有不少重大的应用(如阿里巴巴、腾讯等),这方面的成果在世界范围内已经属于领先水平了。
要真正引领世界人工智能的潮流,在基础科学方面的研究是最为关键的,必须要有几个世界级科研领军人物才可能引领这个潮流。只有达到「此时立在最高山」的境地,才能形成「天高地平千万里」般高屋建瓴的气势。同时根深才能叶茂,否则经不起风吹雨打。在发展战略上,我们要多一点着眼于根,而不仅仅是枝叶。对中国人工智能的未来发展,重中之重在远虑而不是近忧。
而基础科学领域顶尖人才的培养,恰恰是我国又一个极大的短板。高考制度最大限度地保证了教育公平,基于这个体制的我国高等教育,从人才培养的平均水平上说,在国际上是比较高的,但同时也导致了一个很严重的结果,就是很容易把潜在的、有个性的天才式人物给抹杀掉了。
此外,基础科学的研究需要高秉赋、高水平的学者具有「板凳甘坐十年冷」的研究精神和执着态度。现在这种学者太少了。
所以总体上看,我国要在 2049 年引领世界人工智能的潮流,应该说是一项非常艰巨的任务,必须从长计议,综合施策。
当前人工智能领域取得的突破,大多是在特定领域的特定任务上的突破,如 AlphaGo 在围棋比赛中战胜人类冠军,人工智能程序在大规模图像识别任务中超越了人类的水平,人工智能系统诊断皮肤癌达到专业医生水平等。可以说,在局部智能水平的单项测试中,人工智能可以超越人类智能。
但通用人工智能尚处于起步阶段。通用人工智能也被称为「强人工智能」,是指达到人类水平的、能够自适应地应对外界环境挑战的、具有自我意识的人工智能。人的大脑是一个通用的智能系统,能举一反三、融会贯通,可进行判断、推理、学习、思考、规划、设计等,可谓「一脑万用」。真正意义上完备的人工智能系统应该是一个通用的智能系统。因此,在通用人工智能的实现上,我们还有很长的路要走。
强人工智能到 2049 年能不能研究出来,难以预料。在通往这个目标的道路上,会面临很多难以克服的困难和挑战。清华大学计算机系孙茂松教授认为,这取决于若干重要因素。
第一,脑科学会有什么突破,脑科学的研究能否给人工智能带来足够多的启示。虽然历史上人工智能的发展从脑科学受益有限,但强人工智能的研究越来越期待脑科学的研究成果,则是毫无疑问的。
第二,不管强人工智能的发展需要依赖多少支持条件,其中有一个条件是绝对离不开的,这就是需要形式化的人类知识体系作为支持。但很可惜,这个知识体系目前并不存在。虽然已经有号称规模巨大的知识图谱,但稍加考察就会发现,它所包含的知识,无论是在广度上还是在深度上,都还是比较肤浅的。没有形式化的人类知识体系,机器推理就难以实现,人工智能的可解释性和健壮性都无从谈起。而要建成这个知识体系,需要有深远眼光和大格局的学者,带领一批人,进行持之以恒的资源建设工作。同时,需要相当长期的、稳定的经费投入,才有做出来的可能(也存在着做不出来的风险)。但非常可惜,各国政府都不太愿意支持这种长周期、带有一定风险性的资源建设工作。
第三,要看有没有更具创意的算法,能够把上述重要因素更有效地融合起来。
目前来看,我们应该先集中力量研究、解决这些比较现实的科学问题,然后才有条件讨论强人工智能的问题。否则,坐而论道,未免流于空谈。
可以设想,如果有朝一日强人工智能真的研究出来了,那么机器智能就真的很可能超越人类智能,这将是世界进化史上的一个断代式的质变。我不相信这种质变会来得这么容易,应该是一个很漫长的过程。所以,我认为到2049年,不太可能出现强人工智能。
参考链接:
https://www.ae-info.org/ae/Member/Sun_Maosong
http://www.bjd.com.cn/a/202008/05/WS5f2a7c47e4b0bde5c60731e0.html