We introduce ChrEnTranslate, an online machine translation demonstration system for translation between English and an endangered language Cherokee. It supports both statistical and neural translation models as well as provides quality estimation to inform users of reliability, two user feedback interfaces for experts and common users respectively, example inputs to collect human translations for monolingual data, word alignment visualization, and relevant terms from the Cherokee-English dictionary. The quantitative evaluation demonstrates that our backbone translation models achieve state-of-the-art translation performance and our quality estimation well correlates with both BLEU and human judgment. By analyzing 216 pieces of expert feedback, we find that NMT is preferable because it copies less than SMT, and, in general, current models can translate fragments of the source sentence but make major mistakes. When we add these 216 expert-corrected parallel texts back into the training set and retrain models, equal or slightly better performance is observed, which indicates the potential of human-in-the-loop learning. Our online demo is at https://chren.cs.unc.edu/ , our code is open-sourced at https://github.com/ZhangShiyue/ChrEnTranslate , and our data is available at https://github.com/ZhangShiyue/ChrEn


翻译:我们引入了ChrEntranslate,这是一个用于英语和濒危语言Cherokee之间翻译的在线机器翻译演示系统,它支持统计和神经翻译模式,并提供质量估算,向用户通报可靠性、专家和普通用户的两种用户反馈界面,为收集人类翻译单语数据提供实例投入,对单语数据进行词校准视觉化,以及切罗基-英语词典的相关术语。定量评估表明,我们的骨干翻译模式实现了最新翻译业绩,我们的质量估算与BLEU和人类判断都非常相关。通过分析216项专家反馈,我们发现NMT更可取,因为它的拷贝少于SMT,而且一般来说,目前的模型可以翻译源句的碎片,但犯重大错误。当我们将这些216项专家校正的平行文本重新纳入培训组合和再培训模式时,我们观察到了相同或稍好的业绩,这表明人类在网上学习的潜力。我们的在线演示在https://chren.c.unc.edu/,我们的代码是在https://chrub/Enshemb/Zreaddal。

0
下载
关闭预览

相关内容

专知会员服务
60+阅读 · 2020年3月19日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
164+阅读 · 2020年3月18日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
计算机 | IUI 2020等国际会议信息4条
Call4Papers
6+阅读 · 2019年6月17日
LibRec 精选:如何评估交互式推荐系统?
LibRec智能推荐
8+阅读 · 2019年5月5日
LibRec 精选:推荐系统的论文与源码
LibRec智能推荐
14+阅读 · 2018年11月29日
计算机视觉领域顶会CVPR 2018 接受论文列表
人工智能 | 国际会议/SCI期刊约稿信息9条
Call4Papers
3+阅读 · 2018年1月12日
【推荐】SLAM相关资源大列表
机器学习研究会
10+阅读 · 2017年8月18日
Arxiv
5+阅读 · 2018年5月28日
VIP会员
相关资讯
Top
微信扫码咨询专知VIP会员