统一意义表示(UMR)是一种通用跨语言意义表示,是我们在国家科学基金会(NSF)支持的“为自然语言处理构建统一意义表示”项目下开发的。UMR基于抽象意义表示法(AMR),但在本质上以多种方式扩展和适应AMR。AMR是一个句子级表示,主要关注谓词-参数结构,而UMR是一个文档级表示,它也捕捉句子边界之外的语义关系。在句子层面,“量词”增加了方面、人称、数以及量词范围。在文档级别,UMR添加了时间和模式依赖关系以及引用关系。UMR还对AMR进行了调整,使其具有跨语言适用性,特别是对形态复杂的低资源语言。UMR通过为那些没有PropBank风格的谓词特定语义角色的词典的语言定义一组与语言无关的参与者角色来实现这一点,并通过在格中分层安排UMR语义概念和关系来适应跨语言的可变性,以便针对各个语言的UMR开发人员可以根据其语法化模式选择最适合该语言的粒度级别。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“MNLP” 就可以获取《【LREC2022教程】自然语言处理统一意义表示学习,113页ppt》专知下载链接