报告中,宗成庆研究员首先对自然语言处理的基本概念、研究内容和理论方法进行了简要梳理,介绍了自然语言处理这一学科的产生和发展,强调了计算机理解自然语言的科学意义和应用价值。
而后分析了自然语言处理面临的技术挑战,包括自然语言中大量存在的未知语言现象、歧义词汇和结构、隐喻表达、以及翻译问题中不同语言之间概念的不对等性等,语义概念的表示和计算、说话人意图的理解和推理、以及语用场景的分析是当前面临的核心挑战。在介绍了自然语言处理的基本方法后,宗成庆研究员通过两个具体实例展示了不同方法的实现过程及其存在的问题。
活动现场
他认为,虽然目前NLP技术在很多领域得到了成功的应用,但远未做到自然语言的深度理解,在这一领域仍然存在大量的难题和探索的空间,如现有的翻译模型无法准确处理篇章范围内的指代问题、无法区分由于细微文字或句法差异造成的句子语义反转、无法从译员的译后编辑过程中自动学习翻译知识等等。
团队出版主要论著
此外,宗成庆研究员还介绍了自然语言处理团队的研究方向及部分研发成果。目前团队的主要研究方向包括自然语言处理基础任务、机器翻译、知识图谱、信息抽取、问答系统、情感分类、基于多模态信息融合的自然语言处理、类脑启发的自然语言处理方法研究等。
团队近年来在上述各方向上都进行了深入研究和探索,产出了一批优秀成果,包括三部专著:《统计自然语言处理》、《文本数据挖掘》和《知识图谱》。报告最后,宗成庆研究员对该学科未来发展的趋势和方向进行了简要分析和展望。
完整版教程链接:
链接:
https://pan.baidu.com/s/1V9J5DNMhMAkv-fC_GcBZ0w
提取码:kral
宗成庆研究员团队主页:
http://www.nlpr.ia.ac.cn/cip/introduction.htm
下附讲座完整PPT
更多精彩内容,欢迎关注
中科院自动化所官方网站:
http://www.ia.ac.cn
欢迎后台留言、推荐您感兴趣的话题、内容或资讯,小编恭候您的意见和建议!如需转载或投稿,请后台私信。
来源:自动化所模式识别国家重点实验室
编辑:鲁宁、欧梨成