1月20日,滴滴发起的ACL 2020 IWSLT “开放领域中日翻译”任务正式发布数据,邀请全球各界高手前来挑战。
ACL (Conference of the Association for Computational Linguistics) 是全球自然语言处理领域的顶级会议,今年将于7月5日-10日在美国西雅图举行。IWSLT (The International Conference on Spoken Language Translation) 则是国际上以口语翻译为核心的顶级评测大赛。每年IWSLT都能吸引全球业界和学术界的多路顶级团队参与。
本次ACL 2020 IWSLT共提供了六项口语翻译的相关评测任务。其中,滴滴发起了开放领域中日翻译任务(主页为:http://iwslt.org/doku.php?id=open_domain_translation),提供了一个大规模的中日双语语料数据集。该数据集既包含现有的公开的中日平行语料(200万对),也包含了从大约1万个网站上爬取的中日近似平行语料(6000万对)。
该任务旨在鼓励以下方向的研究:1)亚洲语言间的机器翻译;2)如何在大量噪音的数据中提高翻译质量;3)更加智能的翻译语料预处理以及对数据源信息的利用。
扫描二维码
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。
▽ 点击 | 阅读原文 | 报名参赛