In this work, we unify several existing decoding strategies for punctuation prediction in one framework and introduce a novel strategy which utilises multiple predictions at each word across different windows. We show that significant improvements can be achieved by optimising these strategies after training a model, only leading to a potential increase in inference time, with no requirement for retraining. We further use our decoding strategy framework for the first comparison of tagging and classification approaches for punctuation prediction in a real-time setting. Our results show that a classification approach for punctuation prediction can be beneficial when little or no right-side context is available.


翻译:在这项工作中,我们将现有的几个标点预测解码战略统一在一个框架中,并引入一个新颖的战略,利用不同窗口每个字的多个预测。我们表明,通过优化这些战略,在培训一个模型之后,只有导致推论时间的潜在增加,而无需再培训,才能取得显著的改进。我们进一步使用我们的解码战略框架,首次比较实时标点预测的标记和分类方法。我们的结果显示,当很少有或没有右侧环境时,标点预测的分类方法会有益。

0
下载
关闭预览

相关内容

专知会员服务
78+阅读 · 2021年10月12日
因果图,Causal Graphs,52页ppt
专知会员服务
249+阅读 · 2020年4月19日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
154+阅读 · 2019年10月12日
已删除
无人机
3+阅读 · 2019年3月4日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
Arxiv
3+阅读 · 2018年3月28日
VIP会员
相关VIP内容
专知会员服务
78+阅读 · 2021年10月12日
因果图,Causal Graphs,52页ppt
专知会员服务
249+阅读 · 2020年4月19日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
154+阅读 · 2019年10月12日
相关资讯
已删除
无人机
3+阅读 · 2019年3月4日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
Top
微信扫码咨询专知VIP会员