主题: Storytelling from Structured Data and Knowledge Graphs : An NLG Perspective
摘要: 在本教程中,我们讨论将结构化数据(如表格形式的数据)和知识库(如知识图谱)翻译成自然语言论述的基础、方法和系统开发方面。本教程涵盖自然语言生成(NLG)的挑战和方法,主要关注(结构化)数据到文本的范式。我们的与会者将能够了解以下内容:(1)关于如何应用现代自然语言处理和自然语言处理技术来描述和总结非语言性质或具有某种结构的文本数据的基本观点和趋势,以及(2)一些有趣的开放式问题,这将为今后的研究做出重大贡献。我们将概述各种方法,从数据表示技术到适用于数据的领域解决方案,再到文本问题设置。从传统的基于规则/启发式驱动、现代的数据驱动和超现代的深层神经风格体系结构出发,讨论了各种解决方案,并简要讨论了评价和质量评估。 由于大规模的领域独立标记(并行)数据很少用于数据到文本的问题,本教程的很大一部分将致力于无监督、可伸缩和领域适应性的方法。
邀请嘉宾:
Abhijit Mishra,目前是印度班加罗尔IBM Research的一员,担任人工智能技术系的研究科学家。在加入IBM Research之前,他是孟买IIT计算机科学与工程系(CSE)的博士学者,在Pushpak Bhattacharyya教授的指导下工作。
Anirban Laha,他目前是亚伦·库尔维尔教授建议的蒙特勒大学(MILA)一年级博士生。他的兴趣在于机器学习/深度学习在自然语言处理中的应用。此前,他在IBM Research的自然语言生成(NLG)项目中工作了三年,并在顶级会议和期刊上发表过论文,如NeurIPS、ACL、NAACL-HLT和计算语言学。在IBM,他还为IBM项目辩论会做出了贡献,该会最近在全球范围内获得了广泛的新闻报道,因为一场现场机器与人类的辩论(更多新闻)。在加入IBM之前,他曾在微软必应广告公司(2013-2015)担任应用科学家,在亚马逊网站(2010-2011)担任SDE。