摘要:近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。

http://jcip.cipsc.org.cn/CN/abstract/abstract2995.shtml

成为VIP会员查看完整内容
78

相关内容

最新《知识驱动的文本生成》综述论文,44页pdf
专知会员服务
77+阅读 · 2020年10月13日
专知会员服务
24+阅读 · 2020年9月11日
专知会员服务
27+阅读 · 2020年9月9日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
专知会员服务
108+阅读 · 2020年5月21日
基于视觉的三维重建关键技术研究综述
专知会员服务
160+阅读 · 2020年5月1日
 图像内容自动描述技术综述
专知会员服务
86+阅读 · 2019年11月17日
零样本图像分类综述 : 十年进展
专知会员服务
126+阅读 · 2019年11月16日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
79+阅读 · 2019年10月12日
【中科院】命名实体识别技术综述
专知
16+阅读 · 2020年4月21日
多模态深度学习综述,18页pdf
专知
48+阅读 · 2020年3月29日
【综述】关键词生成,附10页pdf论文下载
专知
9+阅读 · 2019年10月16日
文本+视觉,多篇 Visual/Video BERT 论文介绍
AI科技评论
22+阅读 · 2019年8月30日
无参考图像质量评价研究进展综述
人工智能前沿讲习班
46+阅读 · 2019年2月15日
Image Captioning 36页最新综述, 161篇参考文献
专知
90+阅读 · 2018年10月23日
Arxiv
15+阅读 · 2019年6月25日
Arxiv
4+阅读 · 2018年11月7日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
VIP会员
相关VIP内容
最新《知识驱动的文本生成》综述论文,44页pdf
专知会员服务
77+阅读 · 2020年10月13日
专知会员服务
24+阅读 · 2020年9月11日
专知会员服务
27+阅读 · 2020年9月9日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
专知会员服务
108+阅读 · 2020年5月21日
基于视觉的三维重建关键技术研究综述
专知会员服务
160+阅读 · 2020年5月1日
 图像内容自动描述技术综述
专知会员服务
86+阅读 · 2019年11月17日
零样本图像分类综述 : 十年进展
专知会员服务
126+阅读 · 2019年11月16日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
79+阅读 · 2019年10月12日
相关资讯
【中科院】命名实体识别技术综述
专知
16+阅读 · 2020年4月21日
多模态深度学习综述,18页pdf
专知
48+阅读 · 2020年3月29日
【综述】关键词生成,附10页pdf论文下载
专知
9+阅读 · 2019年10月16日
文本+视觉,多篇 Visual/Video BERT 论文介绍
AI科技评论
22+阅读 · 2019年8月30日
无参考图像质量评价研究进展综述
人工智能前沿讲习班
46+阅读 · 2019年2月15日
Image Captioning 36页最新综述, 161篇参考文献
专知
90+阅读 · 2018年10月23日
微信扫码咨询专知VIP会员