This paper presents a unified end-to-end frame-work for both streaming and non-streamingspeech translation. While the training recipes for non-streaming speech translation have been mature, the recipes for streaming speechtranslation are yet to be built. In this work, wefocus on developing a unified model (UniST) which supports streaming and non-streaming ST from the perspective of fundamental components, including training objective, attention mechanism and decoding policy. Experiments on the most popular speech-to-text translation benchmark dataset, MuST-C, show that UniST achieves significant improvement for non-streaming ST, and a better-learned trade-off for BLEU score and latency metrics for streaming ST, compared with end-to-end baselines and the cascaded models. We will make our codes and evaluation tools publicly available.


翻译:本文件为流译和非流译翻译提供了一个统一的端对端框架工作框架。虽然非流译语音翻译的培训食谱已经成熟,但流译语音翻译的食谱尚未建立。在这项工作中,我们侧重于开发一个统一的模型(UniST),从培训目标、关注机制和解码政策等基本组成部分的角度支持流和非流出ST。关于最受欢迎的语音对文本翻译基准数据集(MuST-C)的实验显示,UniST在非流译ST方面取得了显著的改进,并且与端到端基线和分级模型相比,BLEU的分数和流流的延时度衡量标准取得了更好的取舍。我们将公布我们的代码和评价工具。

0
下载
关闭预览

相关内容

【ACL2020】端到端语音翻译的课程预训练
专知会员服务
6+阅读 · 2020年7月2日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
按 CompletableFuture 完成顺序实现 Streaming Future
ImportNew
6+阅读 · 2019年5月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
LibRec 精选:基于LSTM的序列推荐实现(PyTorch)
LibRec智能推荐
50+阅读 · 2018年8月27日
VIP会员
相关资讯
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
按 CompletableFuture 完成顺序实现 Streaming Future
ImportNew
6+阅读 · 2019年5月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
LibRec 精选:基于LSTM的序列推荐实现(PyTorch)
LibRec智能推荐
50+阅读 · 2018年8月27日
Top
微信扫码咨询专知VIP会员