Image captioning is a multimodal task involving computer vision and natural language processing, where the goal is to learn a mapping from the image to its natural language description. In general, the mapping function is learned from a training set of image-caption pairs. However, for some language, large scale image-caption paired corpus might not be available. We present an approach to this unpaired image captioning problem by language pivoting. Our method can effectively capture the characteristics of an image captioner from the pivot language (Chinese) and align it to the target language (English) using another pivot-target (Chinese-English) parallel corpus. We evaluate our method on two image-to-English benchmark datasets: MSCOCO and Flickr30K. Quantitative comparisons against several baseline approaches demonstrate the effectiveness of our method.


翻译:图像字幕是一项多式任务,涉及计算机视觉和自然语言处理,目标是从图像到自然语言描述学习绘图。一般而言,绘图功能是从一组图像字幕培训中学习的。然而,对某些语言来说,可能没有大规模图像字幕配对功能。我们提出了一个方法,通过语言支线解决这个未配对的图像字幕问题。我们的方法可以有效地捕捉一个主轴语言(中文)的图像字幕的特征,并使用另一个主轴-目标(中文-英文)平行材料(中文-英文)将其与目标语言(英文)相匹配。我们评估了我们关于两个图像-英文基准数据集的方法:MCCO和Flick30K。 与若干基线方法的定量比较表明我们方法的有效性。

4
下载
关闭预览

相关内容

图像字幕(Image Captioning),是指从图像生成文本描述的过程,主要根据图像中物体和物体的动作。
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Image Captioning 36页最新综述, 161篇参考文献
专知
90+阅读 · 2018年10月23日
自适应注意力机制在Image Caption中的应用
PaperWeekly
10+阅读 · 2018年5月10日
Neural Image Captioning
Arxiv
5+阅读 · 2019年7月2日
Image Captioning: Transforming Objects into Words
Arxiv
7+阅读 · 2019年6月14日
Nocaps: novel object captioning at scale
Arxiv
6+阅读 · 2018年12月20日
Attend More Times for Image Captioning
Arxiv
6+阅读 · 2018年12月8日
Arxiv
21+阅读 · 2018年5月23日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
3+阅读 · 2017年8月15日
VIP会员
相关VIP内容
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Image Captioning 36页最新综述, 161篇参考文献
专知
90+阅读 · 2018年10月23日
自适应注意力机制在Image Caption中的应用
PaperWeekly
10+阅读 · 2018年5月10日
相关论文
Neural Image Captioning
Arxiv
5+阅读 · 2019年7月2日
Image Captioning: Transforming Objects into Words
Arxiv
7+阅读 · 2019年6月14日
Nocaps: novel object captioning at scale
Arxiv
6+阅读 · 2018年12月20日
Attend More Times for Image Captioning
Arxiv
6+阅读 · 2018年12月8日
Arxiv
21+阅读 · 2018年5月23日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
3+阅读 · 2017年8月15日
Top
微信扫码咨询专知VIP会员