摘要: 图像内容自动描述是计算机视觉和自然语言处理领域的一个重要任务,在生活娱乐、智慧 交通以及帮助视觉障碍者理解视觉内容等领域有着广泛而重要的应用价值.相比于图像分类和目标 检测等感知任务,图像内容自动描述是一种更高级别、更复杂的认知任务,对帮助分析和理解图像有 着重要的意义.旨在对现有的图像自动描述技术进行全面的综述.讨论图像内容自动描述中常用的数 据集和评价指标,以及现有图像自动描述技术的性能、优点和局限性。
关键词: 图像内容描述;卷积神经网络;循环神经网络;注意力机制;深度学习