中国计算语言学大会(The China National Conference on Computational Linguistics, CCL)创办于1991年,是中国中文信息学会(CIPS)的旗舰会议。在刚刚结束的第二十届中国计算语言学大会(CCL 2021)中,哈工大社会计算与信息检索研究中心(SCIR)论文Incorporating Commonsense Knowledge into Abstractive Dialogue Summarization via Heterogeneous Graph Networks荣获最佳英文论文奖,作者为冯夏冲博士生,冯骁骋副教授,秦兵教授。
对话作为一种人与人之间的交流方式,其背后由大量的常识知识作为支撑。对话中的参与者通过结合常识知识理解对话上文,做出回复。这种常识知识一方面指明了对话背后蕴含的深层含义,另一方面也建立了句子与句子之间的隐式交互关系。对于对话摘要来讲,常识知识可以表达高层抽象概念,可以十分有效的帮助生成式摘要,提高简洁度和凝练性。除此以外,常识知识还可以作为句子之间的隐式交互关系,建立说话人之间的交互以及起到消歧作用。
本论文针对对话摘要这一任务,探索了常识知识的融入与建模,并设计了一种基于异构图神经网络的摘要生成模型,证明了常识知识的融入与异构性建模对于该任务的重要性,同时也证明了常识知识可以有效提升模型应用于新领域的泛化能力。论文链接:https://aclanthology.org/2021.ccl-1.86/,模型、代码均已开源:https://github.com/xcfcode/DHGN
冯夏冲,哈尔滨工业大学社会计算与信息检索研究中心博士生,导师为秦兵教授,指导教师为冯骁骋副教授。曾在ACL、IJCAI等会议发表学术论文,获博士生国家奖学金等荣誉。
冯骁骋,哈尔滨工业大学社会计算与信息检索研究中心青年拔尖副教授、博士生导师。在ACL、AAAI、IJCAI、TKDE等国际会议及期刊发表论文20余篇。论文引用数量超过1400次,曾获中国中文信息学会优秀博士学位论文奖、黑龙江省科技进步二等奖一项,入选中国科协青年人才托举工程。
秦兵,哈尔滨工业大学计算学部长聘教授、博士生导师。哈尔滨工业大学社会计算与信息检索中心主任。主持多项国家自然科学基金以及国家科技部863项目。科技部科技创新2030“新一代人工智能”重大项目管理专家组成员,中国中文信息学会理事。入选“2020年度人工智能全球女性及AI 2000最具影响力学者榜单”和“福布斯中国2020科技女性榜”。
本期责任编辑:冯骁骋
理解语言,认知社会
以中文技术,助民族复兴