【ICCV2021】用于群体行为识别的动态时空推理网络 - 专知VIP

会员服务 ·

12

群体行为识别 · 动态时空推理网络 ·

2021 年 9 月 15 日

【ICCV2021】用于群体行为识别的动态时空推理网络

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

群体行为识别 (GAR) 是人物行为识别的一个子问题，群体行为由人物的个人行为和人物之间的交互组成，该任务旨在推断场景中人物群体的整体行为标签。GAR有着丰富的应用场景，包括监控视频分析、体育视频解析、社交场景理解等。GAR的关键问题是在给定视频片段的情况下，结合时空交互因素来获得精细的行为特征表示。

最近提出的推理模块主要结合时空交互因素来获得精细的活动表示，最常用的方法主要结合循环神经网络、注意力机制和图神经网络 (GNN)。GNN是GAR中经常采用的方法，GNN在构建的语义图上执行消息传递，并在公开数据集的测试中取得了有竞争力的结果。然而，以前使用GNN的方法只在预定义的图形上对个人之间的交互进行建模，但是存在以下缺点：

对于给定人的交互模式是预先定义的而不是基于目标人的视觉时空上下文，预定义的图推理不适用于所有人的特征更新；
预定义全连接或者交叉连接的图模型很容易导致过度平滑，使特征无法区分并降低性能。

此外，如果扩展到长视频片段或扩展到有很多人的场景，计算开销会显著上涨。

为了解决以上问题，受[1,2]启发，我们提出了动态推理网络 (DIN)，其中包含动态关系 (DR) 和动态游走 (DW) 两个模块。这两个模块组合可以用于预测人物各异的交互图，以便更好地建模交互，如上图所示。对于时空图上的给定人物特征，本文首先定义其时空邻居为时空交互域，该交互域在DR和DW之间共享。

该交互域的大小不会受到空间或时间扩展的影响，从而减少计算。在这个初始化的交互域中，我们使用 DR 来预测一个中心特征的关系矩阵，表示人与人之间的交互关系。然后，为了对长时期的时间和空间依赖性建模，我们使用 DW 来预测域内每个特征的动态游走偏移，动态游走允许局部初始化的交互域可以在全局的时空图上更新特征。DR和DW实现简单，很容易部署到任何广泛使用的主干网络上，我们把这整个时空推理框架称为DIN。

此外，以前的方法很少进行计算复杂度分析，但这是对设计模块的重要评估，因此本文进行了计算复杂性分析，并表明提出的模块在效果更好的同时，计算开销更低。

成为VIP会员查看完整内容

37

相关内容

群体行为识别

群体行为识别

[ICCV2021]自适应多模态选取框架用于视频理解

[ICCV2021]自适应多模态选取框架用于视频理解

专知会员服务

18+阅读 · 2021年10月30日

【ICCV2021】递阶变分神经不确定性模型的随机视频预测

专知会员服务

14+阅读 · 2021年10月9日

【ICCV2021】用于图像复原的动态注意力图学习

专知会员服务

14+阅读 · 2021年9月17日

【ICCV2021】用于视频目标分割的联合归纳式和直推式学习

专知会员服务

10+阅读 · 2021年8月12日

[ICCV2021]AutoMatch：用于目标跟踪的自动匹配网络设计

专知会员服务

20+阅读 · 2021年8月5日

【ICCV2021】用于目标检测和实例分割的新损失函数

专知会员服务

22+阅读 · 2021年7月28日

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

专知会员服务

15+阅读 · 2021年2月15日

【AAAI2020】CompFeat:用于视频实例分割的综合特征聚合

专知会员服务

9+阅读 · 2020年12月10日

[WSDM2021]用于边缘流异常检测的频率因子分解

[WSDM2021]用于边缘流异常检测的频率因子分解

专知会员服务

12+阅读 · 2020年11月24日

【CMU】基于图神经网络的联合检测与多目标跟踪

【CMU】基于图神经网络的联合检测与多目标跟踪

专知会员服务

58+阅读 · 2020年6月24日

KDD20 | 百度地图上用于估计旅行时间的上下文时空图注意网络

KDD20 | 百度地图上用于估计旅行时间的上下文时空图注意网络

图与推荐

4+阅读 · 2020年10月25日

【论文笔记】用于深度时空图建模的Geaph WaveNet

【论文笔记】用于深度时空图建模的Geaph WaveNet

专知

106+阅读 · 2019年11月4日

NeurIPS 2019 | 用于弱监督图像语义分割的新型损失函数

NeurIPS 2019 | 用于弱监督图像语义分割的新型损失函数

PaperWeekly

20+阅读 · 2019年10月8日

【泡泡图灵智库】用于多相机匹配的时空二进制特征

【泡泡图灵智库】用于多相机匹配的时空二进制特征

泡泡机器人SLAM

4+阅读 · 2019年9月16日

论文浅尝 | 将文本建模为关系图，用于联合实体和关系提取

论文浅尝 | 将文本建模为关系图，用于联合实体和关系提取

开放知识图谱

77+阅读 · 2019年9月14日

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

新智元

20+阅读 · 2019年5月6日

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

泡泡机器人SLAM

22+阅读 · 2018年12月4日

KDD 2018 | 腾讯提出用于文本匹配的多信道信息交叉模型，在真实任务中表现优异

KDD 2018 | 腾讯提出用于文本匹配的多信道信息交叉模型，在真实任务中表现优异

机器之心

4+阅读 · 2018年6月6日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

图注意力网络

图注意力网络

科技创新与创业

35+阅读 · 2017年11月22日

Denoising Diffusion Implicit Models

Arxiv

1+阅读 · 2021年11月4日

QA-GNN: Reasoning with Language Models and Knowledge Graphs for Question Answering

Arxiv

20+阅读 · 2021年5月27日

Intra-Inter Camera Similarity for Unsupervised Person Re-Identification

Arxiv

3+阅读 · 2021年3月22日

Principal Neighbourhood Aggregation for Graph Nets

Principal Neighbourhood Aggregation for Graph Nets

Arxiv

17+阅读 · 2020年6月7日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

A Survey on Knowledge Graphs: Representation, Acquisition and Applications

Arxiv

93+阅读 · 2020年2月2日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

Videos as Space-Time Region Graphs

Arxiv

4+阅读 · 2018年6月5日

A framework with updateable joint images re-ranking for Person Re-identification

Arxiv

6+阅读 · 2018年3月8日

Arxiv

7+阅读 · 2018年1月24日

VIP会员

相关主题

群体行为识别

动态时空推理网络

相关VIP内容

[ICCV2021]自适应多模态选取框架用于视频理解

[ICCV2021]自适应多模态选取框架用于视频理解

专知会员服务

18+阅读 · 2021年10月30日

【ICCV2021】递阶变分神经不确定性模型的随机视频预测

专知会员服务

14+阅读 · 2021年10月9日

【ICCV2021】用于图像复原的动态注意力图学习

专知会员服务

14+阅读 · 2021年9月17日

【ICCV2021】用于视频目标分割的联合归纳式和直推式学习

专知会员服务

10+阅读 · 2021年8月12日

[ICCV2021]AutoMatch：用于目标跟踪的自动匹配网络设计

专知会员服务

20+阅读 · 2021年8月5日

【ICCV2021】用于目标检测和实例分割的新损失函数

专知会员服务

22+阅读 · 2021年7月28日

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

专知会员服务

15+阅读 · 2021年2月15日

【AAAI2020】CompFeat:用于视频实例分割的综合特征聚合

专知会员服务

9+阅读 · 2020年12月10日

[WSDM2021]用于边缘流异常检测的频率因子分解

[WSDM2021]用于边缘流异常检测的频率因子分解

专知会员服务

12+阅读 · 2020年11月24日

【CMU】基于图神经网络的联合检测与多目标跟踪

【CMU】基于图神经网络的联合检测与多目标跟踪

专知会员服务

58+阅读 · 2020年6月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

KDD20 | 百度地图上用于估计旅行时间的上下文时空图注意网络

KDD20 | 百度地图上用于估计旅行时间的上下文时空图注意网络

图与推荐

4+阅读 · 2020年10月25日

【论文笔记】用于深度时空图建模的Geaph WaveNet

【论文笔记】用于深度时空图建模的Geaph WaveNet

专知

106+阅读 · 2019年11月4日

NeurIPS 2019 | 用于弱监督图像语义分割的新型损失函数

NeurIPS 2019 | 用于弱监督图像语义分割的新型损失函数

PaperWeekly

20+阅读 · 2019年10月8日

【泡泡图灵智库】用于多相机匹配的时空二进制特征

【泡泡图灵智库】用于多相机匹配的时空二进制特征

泡泡机器人SLAM

4+阅读 · 2019年9月16日

论文浅尝 | 将文本建模为关系图，用于联合实体和关系提取

论文浅尝 | 将文本建模为关系图，用于联合实体和关系提取

开放知识图谱

77+阅读 · 2019年9月14日

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

新智元

20+阅读 · 2019年5月6日

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

泡泡机器人SLAM

22+阅读 · 2018年12月4日

KDD 2018 | 腾讯提出用于文本匹配的多信道信息交叉模型，在真实任务中表现优异

KDD 2018 | 腾讯提出用于文本匹配的多信道信息交叉模型，在真实任务中表现优异

机器之心

4+阅读 · 2018年6月6日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

图注意力网络

图注意力网络

科技创新与创业

35+阅读 · 2017年11月22日

相关论文

Denoising Diffusion Implicit Models

Arxiv

1+阅读 · 2021年11月4日

QA-GNN: Reasoning with Language Models and Knowledge Graphs for Question Answering

Arxiv

20+阅读 · 2021年5月27日

Intra-Inter Camera Similarity for Unsupervised Person Re-Identification

Arxiv

3+阅读 · 2021年3月22日

Principal Neighbourhood Aggregation for Graph Nets

Principal Neighbourhood Aggregation for Graph Nets

Arxiv

17+阅读 · 2020年6月7日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

A Survey on Knowledge Graphs: Representation, Acquisition and Applications

Arxiv

93+阅读 · 2020年2月2日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

Videos as Space-Time Region Graphs

Arxiv

4+阅读 · 2018年6月5日

A framework with updateable joint images re-ranking for Person Re-identification

Arxiv

6+阅读 · 2018年3月8日

Arxiv

7+阅读 · 2018年1月24日

微信扫码咨询专知VIP会员