Automatically identifying harmful content in video is an important task with a wide range of applications. However, due to the difficulty of collecting high-quality labels as well as demanding computational requirements, the task has not yet had a fully general approach. Typically, only small subsets of the problem are considered, such as identifying violent content. In cases where the general problem is tackled, approximations and simplifications are made to deal with the lack of labels and computational complexity. In this work, we identify and tackle some of the main obstacles. First, we create an open dataset of 3589 video clips from film trailers and annotated by professionals in the field. Second, we perform an analysis of our constructed dataset, investigating among other things the relation between clip and trailer level annotations. Lastly, we train audiovisual models on our dataset and conduct an in-depth study on our modeling choices. We find that results greatly improve by combining the visual and audio modality and that pre-training on large-scale video recognition datasets as well as class balanced sampling further improves performance. Further details of our dataset is available at this webpage: https://vidharm.github.io/.


翻译:自动识别视频中的有害内容是一项重要任务,其应用范围很广。然而,由于难以收集高质量标签和要求严格的计算要求,这项任务尚未完全采用一般方法。通常,只考虑问题中的一小部分,例如暴力内容。在解决一般性问题的情况下,采用近似和简化方法处理缺乏标签和计算复杂性的问题。在这项工作中,我们查明并处理一些主要障碍。首先,我们从电影拖车和实地专业人员注解的3 589个视频短片中创建了一个开放数据集。第二,我们分析我们建造的数据集,调查剪辑和拖车级别说明之间的关系。最后,我们用我们的数据集来培训视听模型模型,并对我们的模型选择进行深入研究。我们发现,通过将视觉和音频模式结合起来,以及大规模视频识别数据集的预先培训以及分类平衡抽样,结果大为改善了业绩。我们数据集的更多细节可见此网页:https://vidharm.githhub.bio。

0
下载
关闭预览

相关内容

因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
163+阅读 · 2020年3月18日
【论文推荐】小样本视频合成,Few-shot Video-to-Video Synthesis
专知会员服务
23+阅读 · 2019年12月15日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
150+阅读 · 2019年10月12日
Hierarchically Structured Meta-learning
CreateAMind
25+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
LibRec 精选:近期15篇推荐系统论文
LibRec智能推荐
5+阅读 · 2019年3月5日
LibRec 精选:推荐系统的常用数据集
LibRec智能推荐
17+阅读 · 2019年2月15日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Python机器学习教程资料/代码
机器学习研究会
8+阅读 · 2018年2月22日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Arxiv
0+阅读 · 2021年11月8日
Arxiv
0+阅读 · 2021年11月8日
Arxiv
15+阅读 · 2021年7月14日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
25+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
LibRec 精选:近期15篇推荐系统论文
LibRec智能推荐
5+阅读 · 2019年3月5日
LibRec 精选:推荐系统的常用数据集
LibRec智能推荐
17+阅读 · 2019年2月15日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Python机器学习教程资料/代码
机器学习研究会
8+阅读 · 2018年2月22日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Top
微信扫码咨询专知VIP会员