【导读】自然语言处理是人工智能领域研究的核心内容之一,近年来取得了快速进展和广泛应用,在学术界和企业界备受瞩目。中科院自动化研究所自然语言处理团队负责人宗成庆研究员的报告从学科产生与发展、技术挑战、基本方法、应用举例、技术现状等多个视角对自然语言处理领域进行了全面梳理,并简要介绍了其团队近年来的主要工作,以及对该学科未来发展方向的分析和展望。我们希望这份报告能够帮助读者了解学科发展的脉络,激发研究兴趣,思考核心问题,领悟未来走向。
2019年5月10日,中科院自动化研究所自然语言处理团队负责人宗成庆研究员在智能化大厦第1会议室模式识别国家重点实验室内部交流会上作了题为“自然语言处理方法与应用”的学术报告。马颂德研究员、刘成林研究员等老师和研究所近百名学生参加了报告会。近两个小时的报告活动座无虚席,讨论热烈,得到了很好的反响。
图1:活动座无虚席
图2:报告现场
讲座首先对自然语言处理的基本概念、研究内容和理论方法进行了简要的梳理,介绍了自然语言处理这一学科的产生和发展,强调了计算机理解自然语言的科学意义和应用价值。接着,对自然语言处理面临的技术挑战进行了分析,包括自然语言中大量存在的未知语言现象、歧义词汇和结构、隐喻表达、以及翻译问题中不同语言之间概念的不对等性等,语义概念的表示和计算、说话人意图的理解和推理、以及语用场景的分析是当前面临的核心挑战。之后,宗老师介绍了自然语言处理的基本方法,通过两个具体实例展示了不同方法的实现过程及其存在的问题。他认为,虽然目前NLP技术在很多领域得到了成功的应用,但远未做到自然语言的深度理解,在这一领域仍然存在大量的难题和探索的空间,如现有的翻译模型无法准确处理篇章范围内的指代问题、无法区分由于细微文字或句法差异造成的句子语义反转、无法从译员的译后编辑过程中自动学习翻译知识等等。
图3:团队出版主要论著
最后,宗老师介绍了自然语言处理团队的研究方向及部分研发成果。目前团队的主要研究方向包括自然语言处理基础任务、机器翻译、知识图谱、信息抽取、问答系统、情感分类、基于多模态信息融合的自然语言处理、类脑启发的自然语言处理方法研究等,团队近年来在上述各方向上都进行了深入研究和探索,产出了一批优秀成果,包括三部专著:《统计自然语言处理》、《文本数据挖掘》和《知识图谱》。在报告最后,宗老师对该学科未来发展的趋势和方向进行了简要分析和展望。
图4:讨论现场
完整版教程链接:
模式识别国家重点实验室后台对话框回复自然语言处理方法及应用,下载完整版教程。
宗成庆老师团队主页主页:
http://www.nlpr.ia.ac.cn/cip/introduction.htm
附PPT全文
点击文末阅读原文,加入 NLP 论文讨论小组与同行切磋、交流