Detecting abnormal activities in real-world surveillance videos is an important yet challenging task as the prior knowledge about video anomalies is usually limited or unavailable. Despite that many approaches have been developed to resolve this problem, few of them can capture the normal spatio-temporal patterns effectively and efficiently. Moreover, existing works seldom explicitly consider the local consistency at frame level and global coherence of temporal dynamics in video sequences. To this end, we propose Convolutional Transformer based Dual Discriminator Generative Adversarial Networks (CT-D2GAN) to perform unsupervised video anomaly detection. Specifically, we first present a convolutional transformer to perform future frame prediction. It contains three key components, i.e., a convolutional encoder to capture the spatial information of the input video clips, a temporal self-attention module to encode the temporal dynamics, and a convolutional decoder to integrate spatio-temporal features and predict the future frame. Next, a dual discriminator based adversarial training procedure, which jointly considers an image discriminator that can maintain the local consistency at frame-level and a video discriminator that can enforce the global coherence of temporal dynamics, is employed to enhance the future frame prediction. Finally, the prediction error is used to identify abnormal video frames. Thoroughly empirical studies on three public video anomaly detection datasets, i.e., UCSD Ped2, CUHK Avenue, and Shanghai Tech Campus, demonstrate the effectiveness of the proposed adversarial spatio-temporal modeling framework.


翻译:检测真实世界监控视频中的异常活动是一项重要但具有挑战性的任务,因为先前对视频异常的了解通常有限或不存在。尽管已经制定了许多方法来解决这一问题,但其中很少能够有效和高效地捕捉正常的时空模式。此外,现有的作品很少明确考虑到框架层面的当地一致性和视频序列中时间动态的全球一致性。为此,我们提议基于双分辨的双振动反动网络(CT-D2GAN)进行不受监督的视频异常检测。具体地说,我们首先提出一个革命变异器来进行未来框架预测。它包含三个关键组成部分,即:一个革命变异编码器来捕捉输入视频短片的空间信息,一个时间自我注意模块来调节时间动态,以及一个革命变异变变解器来整合磁波时空特征并预测未来框架。接下来,基于双向分析器的视频异常培训程序,它共同考虑一个能够维护本地图像变异变异的图像变异变异变换工具,用于最终的图像变异的图像变异性图像测试框架,用来加强当前变现的图像变现框架。

0
下载
关闭预览

相关内容

专知会员服务
32+阅读 · 2021年9月16日
注意力机制综述
专知会员服务
203+阅读 · 2021年1月26日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
48+阅读 · 2020年7月4日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
6+阅读 · 2021年3月11日
Arxiv
4+阅读 · 2019年5月1日
Arxiv
8+阅读 · 2018年5月21日
Arxiv
4+阅读 · 2018年5月21日
VIP会员
Top
微信扫码咨询专知VIP会员