【简明书】视频摘要概述,55页pdf

2022 年 10 月 24 日 专知


随着网络视频采集设备和应用的广泛发展,如何高效地为用户提供所需的视频内容提出了更高的要求。视频摘要通过创建一个紧凑的视频摘要,方便快速掌握视频内容。很多人致力于视频自动摘要,并提出了各种问题设置和方法。我们的目标是提供这个领域的概述。本综述涵盖了利用深度学习技术的早期研究以及最近的方法。我们描述了视频摘要方法及其基本概念。我们还讨论了基准和评估。我们概述了以前的工作如何处理评估,并详细介绍了评估协议的优点和缺点。最后,我们将讨论该领域的开放挑战。

互联网的广泛使用和价格低廉的视频捕获设备极大地改变了视频创作和消费的格局。特别是,随着视频流媒体服务和社交网络的发展,用户创建的视频比以往任何时候都更加流行。视频创作的快速增长需要先进的技术,以实现所需视频内容的高效消费。这些场景包括提高视频流服务观众的用户体验,为需要浏览大量视频的视频创作者和需要监控监控视频的安全团队提供快速视频浏览功能。

视频摘要通过创建一个紧凑的视频摘要,方便快速掌握视频内容。实现视频摘要的一种简单的方法是提高播放速度或以统一的间隔对短片段进行采样。然而,前者会降低音频质量并扭曲运动(Benaim et al., 2020),而后者可能由于方法的随机采样性质而错过重要内容。与这些简单的解决方案不同,视频摘要的目的是提取观众想要的信息,以便更有效地浏览视频。

根据不同的应用场景,视频摘要的目的有很大的不同。对于体育比赛,观众希望看到对比赛结果至关重要的时刻,而对于监控,视频摘要需要包含不寻常和值得注意的场景。随着越来越多的视频被创造出来,应用场景也在增长,例如,我们开始看到新的视频类型,如视频游戏直播和视频博客(vlog)。这就导致了视频摘要的新问题,因为不同类型的视频具有不同的特点,观众对摘要有不同的要求。这种多样化的应用刺激了该领域的异质研究。视频摘要解决两个主要问题:“一个理想的视频摘要的本质是什么”和“我们如何为视频内容建模”。答案取决于应用场景。虽然对于大多数应用程序场景,这些仍然是未解决的问题,但文献中已经提出了许多有前途的想法。早期的工作对视频摘要的需求做了各种假设,例如独特性(较少冗余)、多样性和趣味性。一些作品专注于制作与用户意图相关、涉及用户交互的视频摘要。最近的研究更多地关注于数据驱动方法,即从带注释的数据集学习所需的视频摘要。

视频内容的计算建模也是视频摘要的一个重要挑战。从低层次特征开始,应用了各种特征表示,如人脸识别和视觉显著性。近年来,主要采用深度神经网络的特征提取方法。一些应用程序进一步利用辅助信息,如纪录片视频的字幕,体育视频的游戏日志,以及用可穿戴摄像头捕捉的以自我为中心的视频的脑电波。本综述的目的是对视频摘要文献提供一个全面的概述。我们回顾了各种视频摘要方法,并比较了它们的基本概念和假设。我们从提出了视频摘要的开创性概念的早期工作开始,还介绍了利用端到端深度学习的最新数据驱动方法。通过对不同研究的应用场景和使用的技术进行分类,我们旨在帮助研究人员和实践者建立针对不同目的和应用场景的视频摘要系统。我们还回顾了现有的基准和评估协议,并讨论了评估视频摘要的关键挑战,由于难以获得地面真相摘要,这是不直接的。我们概述了以前的工作是如何解决围绕评估的挑战的,并讨论了现有评估协议的优点和缺点。最后,我们讨论这个领域的开放挑战。



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“VSO” 就可以获取 【简明书】视频摘要概述,55页pdf》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料

登录查看更多
1

相关内容

视频摘要又称视频浓缩,是对视频内容的一个简单概括,以自动或半自动的方式,先通过运动目标分析,提取运动目标,然后对各个目标的运动轨迹进行分析,将不同的目标拼接到一个共同的背景场景中,并将它们以某种方式进行组合。视频摘要在视频分析和基于内容的视频检索中扮演着重要角色。
【硬核书】推荐系统引擎,306页pdf
专知会员服务
48+阅读 · 2022年12月13日
深度学习视频超分辨率技术概述
专知会员服务
36+阅读 · 2022年7月18日
《人工智能在无人机中的应用》报告,60页pdf
专知会员服务
153+阅读 · 2022年3月30日
持续学习最新综述论文,29页pdf
专知会员服务
117+阅读 · 2021年4月22日
「深度图像检索: 2012到2020」大综述论文,21页pdf
专知会员服务
41+阅读 · 2021年1月30日
【CIKM2020】推荐系统的神经模板解释生成
专知会员服务
33+阅读 · 2020年9月9日
专知会员服务
133+阅读 · 2020年8月24日
【硬核书】数据科学,282页pdf
专知
23+阅读 · 2022年11月29日
【简明书】强化学习的基础,111页pdf
专知
1+阅读 · 2022年11月16日
「图学习推荐系统」最新2022综述
专知
5+阅读 · 2022年9月18日
深度学习视频超分辨率技术概述
专知
0+阅读 · 2022年7月18日
厦大最新《强化学习推荐系统》综述论文
机器学习与推荐算法
7+阅读 · 2021年9月24日
推荐系统之矩阵分解家族
图与推荐
13+阅读 · 2020年3月28日
推荐系统概述
Python开发者
11+阅读 · 2018年9月27日
【推荐系统】一文读懂推荐系统知识体系
产业智能官
43+阅读 · 2017年10月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
26+阅读 · 2020年3月13日
Deep Learning in Video Multi-Object Tracking: A Survey
Arxiv
57+阅读 · 2019年7月31日
Arxiv
19+阅读 · 2019年4月5日
VIP会员
相关VIP内容
【硬核书】推荐系统引擎,306页pdf
专知会员服务
48+阅读 · 2022年12月13日
深度学习视频超分辨率技术概述
专知会员服务
36+阅读 · 2022年7月18日
《人工智能在无人机中的应用》报告,60页pdf
专知会员服务
153+阅读 · 2022年3月30日
持续学习最新综述论文,29页pdf
专知会员服务
117+阅读 · 2021年4月22日
「深度图像检索: 2012到2020」大综述论文,21页pdf
专知会员服务
41+阅读 · 2021年1月30日
【CIKM2020】推荐系统的神经模板解释生成
专知会员服务
33+阅读 · 2020年9月9日
专知会员服务
133+阅读 · 2020年8月24日
相关资讯
【硬核书】数据科学,282页pdf
专知
23+阅读 · 2022年11月29日
【简明书】强化学习的基础,111页pdf
专知
1+阅读 · 2022年11月16日
「图学习推荐系统」最新2022综述
专知
5+阅读 · 2022年9月18日
深度学习视频超分辨率技术概述
专知
0+阅读 · 2022年7月18日
厦大最新《强化学习推荐系统》综述论文
机器学习与推荐算法
7+阅读 · 2021年9月24日
推荐系统之矩阵分解家族
图与推荐
13+阅读 · 2020年3月28日
推荐系统概述
Python开发者
11+阅读 · 2018年9月27日
【推荐系统】一文读懂推荐系统知识体系
产业智能官
43+阅读 · 2017年10月31日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员