Acquisition of multilingual training data continues to be a challenge in word sense disambiguation (WSD). To address this problem, unsupervised approaches have been proposed to automatically generate sense annotations for training supervised WSD systems. We present three new methods for creating sense-annotated corpora which leverage translations, parallel bitexts, lexical resources, as well as contextual and synset embeddings. Our semi-supervised method applies machine translation to transfer existing sense annotations to other languages. Our two unsupervised methods refine sense annotations produced by a knowledge-based WSD system via lexical translations in a parallel corpus. We obtain state-of-the-art results on standard WSD benchmarks.


翻译:获得多语种培训数据仍然是文字上的一个挑战。为了解决这一问题,我们提议了未经监督的方法,以自动为受监督的WSD系统的培训产生感知说明。我们提出了三种新的方法,用以创建有说明的感知公司,利用翻译、平行的位数、词汇资源以及背景和合成嵌入。我们的半监督方法使用机器翻译将现有的感知说明转移到其他语言。我们的两个未经监督的方法通过平行的文体的基于知识的WSD翻译系统改进感知说明。我们获得了标准的WSD基准的最新结果。

0
下载
关闭预览

相关内容

【经典书】半监督学习,524页pdf
专知会员服务
134+阅读 · 2021年8月20日
【Google】无监督机器翻译,Unsupervised Machine Translation
专知会员服务
35+阅读 · 2020年3月3日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
机器翻译 | Bleu:此蓝;非彼蓝
黑龙江大学自然语言处理实验室
4+阅读 · 2018年3月14日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Deep Co-Training for Semi-Supervised Image Segmentation
Arxiv
3+阅读 · 2018年8月27日
Phrase-Based & Neural Unsupervised Machine Translation
Arxiv
6+阅读 · 2018年2月26日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员