主题:From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction
摘要:从序列标记到关系抽取,再到知识推理,深度神经网络模型在知识抽取任务中取得了最先进的性能。然而,这些渴求数据的模型严重依赖于人工标记的训练数据,并且经常作为黑箱组件运行,减慢了下游应用程序的开发。在这次演讲中,我将介绍我们最近在将结构化先验知识应用到深度神经网络模型中进行知识抽取方面的进展,这两个模型都是在输入数据级别(即,以及在模型架构级别(即,对模型进行编程)。特别地,我将讨论如何在命名实体识别中合并域字典,以及如何在关系提取中建立语义规则,作为输入级结构化先验知识的示例。对于模型编程,我将提出一个基于图神经网络的框架,用于在涉及常识推理的自然语言推理中捕获多关系结构化先验知识作为模型架构的一部分。这些解决方案共同构成了从数据到使用结构化先验知识进行模型编程的路线图。
嘉宾简介:任翔,美国南加州大学计算机科学系助理教授,获美国南加州大学ISI聘任。他也是智能和知识发现(INK)研究实验室的主任,ACM SIGKDD和数据挖掘(SIGKDD)的信息主任,以及USC机器学习中心的成员。之前,他是斯坦福大学的研究学者,并在伊利诺伊大学香槟分校获得了计算机科学博士学位。Ren博士的研究重点是开发标签高效的计算方法,从自然语言数据中提取机器可操作的知识(例如,组合、图形结构表示),并对知识结构进行神经推理。他的研究导致一本书和50多个出版物,覆盖着超过会议教程(KDD、WWW NAACL),并获得了奖项包括谷歌AI教师奖,摩根大通AI研究奖,亚马逊研究奖,ACM SIGKDD论文奖(2018),WWW最佳海报亚军(2018),大卫·j·Kuck优秀论文奖(2017),谷歌博士奖学金(2016),和Yelp数据集挑战奖(2015)。他是福布斯亚洲30位30岁以下富豪之一。