旨在对不同时间跨度的视频帧之间的时间关系和相关性进行建模,表现SOTA!性能优于50Salads、MSTCN++等网络,代码即将开源!

视频中的时间关系建模对于人类动作理解(例如行为识别和动作分割)至关重要。尽管图卷积网络(GCN)在许多任务的关系推理中显示出了令人鼓舞的优势,但在长视频序列上有效地应用图卷积网络仍然是一个挑战。主要原因是大量节点(即视频帧)使GCN难以捕获和建模视频中的时间关系。为了解决这个问题,在本文中,我们引入了一个有效的GCN模块,即膨胀时间图推理模块(DTGRM),该模块旨在对不同时间跨度的视频帧之间的时间关系和相关性进行建模。特别是,我们通过构造多级扩张的时间图来捕获和建模时间关系,其中节点表示视频中不同时刻的帧。此外,为了增强所提出模型的时间推理能力,提出了一种辅助的我监督任务,以鼓励膨胀的时间图推理模块找到并纠正视频中错误的时间关系。在三个具有挑战性的数据集上,我们的DTGRM模型优于最新的动作分割模型:50Salads,在GTEA和Breakfast数据集上。

成为VIP会员查看完整内容
14

相关内容

【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习
专知会员服务
18+阅读 · 2021年2月12日
专知会员服务
44+阅读 · 2021年1月31日
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
36+阅读 · 2021年1月24日
【AAAI2021】层次推理图神经网络
专知会员服务
69+阅读 · 2020年12月27日
专知会员服务
108+阅读 · 2020年12月22日
【AAAI2021】 层次图胶囊网络
专知会员服务
82+阅读 · 2020年12月18日
专知会员服务
19+阅读 · 2020年12月11日
KDD20 | AM-GCN:自适应多通道图卷积网络
专知会员服务
39+阅读 · 2020年8月26日
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
56+阅读 · 2020年6月24日
【AAAI2021】自监督对应学习的对比转换
专知
12+阅读 · 2020年12月11日
KDD20 | AM-GCN:自适应多通道图卷积网络
专知
8+阅读 · 2020年8月26日
CMU、谷歌提出Transformer-XL:学习超长上下文关系
机器之心
9+阅读 · 2019年1月18日
通过时空模型迁移学习的无监督的跨数据集行人重新识别
统计学习与视觉计算组
8+阅读 · 2018年10月23日
CVPR2018:基于时空模型无监督迁移学习的行人重识别
全球人工智能
7+阅读 · 2018年3月26日
VIP会员
相关VIP内容
【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习
专知会员服务
18+阅读 · 2021年2月12日
专知会员服务
44+阅读 · 2021年1月31日
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
36+阅读 · 2021年1月24日
【AAAI2021】层次推理图神经网络
专知会员服务
69+阅读 · 2020年12月27日
专知会员服务
108+阅读 · 2020年12月22日
【AAAI2021】 层次图胶囊网络
专知会员服务
82+阅读 · 2020年12月18日
专知会员服务
19+阅读 · 2020年12月11日
KDD20 | AM-GCN:自适应多通道图卷积网络
专知会员服务
39+阅读 · 2020年8月26日
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
56+阅读 · 2020年6月24日
微信扫码咨询专知VIP会员