来源:探臻科技评论
导读
作者简介
刘知远,清华大学计算机系副教授,研究方向为自然语言处理、知识图谱与语义计算、社会计算与计算社会科学。
一、自然语言理解本质是结构预测
二、自然语言理解的关键是语义表示
三、自然语言有哪些特点
四、自然语言理解难在哪
小结
这里总结了我对自然语言理解到底难在哪儿的看法。自然语言理解作为人工智能的核心问题,正引起越来越多研究者的兴趣,在各类任务上努力探索,自然语言处理最重要的国际学术年会ACL 2020共有3000多篇投稿,受关注程度可见一斑。
自然语言理解大致有不同的层次,我总结研究路径可以大致为:字斟句酌,实现句级消歧和精准理解;瞻前顾后,初步实现文本内的复杂语境建模,建立篇章或对话理解;博学多识,引入更多外部知识,实现跨模态更复杂语境的理解;善解人意,考虑语言的社会性和主观性因素,实现更有“人性”的自然语言理解;冥思苦想,将语言作为思想工具,实现从语言理解到语言使用的跨越,实现创作和规划的能力。
语言是人类文明的象征,是人类智能的集中体现,因此得到非常多学科从不同角度的思考和关注,如语言学中对句法、语义等问题建立的理论,心理语言学对人类语言习得的探讨,语言哲学对语言与世界关系的探讨,认知语言学对隐喻和范畴等问题的探讨,神经语言学对人脑的语言功能的研究,汉语言学界对于汉语流水句、“王冕七岁上死了父亲”等语言现象的研究,等等。这些,都对人类语言不同侧面的特点进行了卓有成效的考察。
自然语言理解的目标是让计算机掌握人类语言能力,需要充分了解和融合这些对人类语言的已有探索成果,以逼近人类语言的本质,才能更好地设计结构化语义表示空间,实现多模态复杂语境的理解,像人那样智能地理解和使用语言。希望有朝一日,计算机也能读懂#NLP太难了#、#自然语言理解太难了#两个话题标签下的那些话。
五、结语
点击阅读原文,查看更多精彩!