【泡泡一分钟】DAP3D-Net: 一种全新的多任务三维深度模型(ICRA2017-9) - 专知

会员服务 ·

0

【泡泡一分钟】DAP3D-Net: 一种全新的多任务三维深度模型(ICRA2017-9)

2017 年 11 月 6 日 泡泡机器人SLAM 泡泡一分钟

每天一分钟，带你读遍机器人顶级会议文章

标题：DAP3D-Net: Where, What and How Actions Occur in Videos?

作者：Li Liu, Yi Zhou, and Ling Shao

来源：ICRA 2017 ( IEEE International Conference on Robotics and Automation )

播音员：水蘸墨

编译：陈诚 周平

欢迎个人转发朋友圈；其他机构或自媒体如需转载，后台留言申请授权

摘要

复杂场景下的活动解析是计算机视觉领域里面一个非常有趣并且十分挑战的话题。

本文介绍了一种全新的基于卷积神经网络和长短期记忆模型的多任务三维深度模型（DAP3D-Net）来有效的对视频进行深度活动学习和分析。特别的，在训练过程中，每个活动片段都被分解成许多小段的连续图像，然后通过一个由神经卷积网络和长短期记忆模型组合的系统来对整个动态活动建模。因此整个活动区域的检测，分类和特性学习都可以同时进行优化。神经网络训练完成以后，我们可以对测试用视频里发生的每个活动进行描述：事件地点，类型以及是如何发生的。

为了对这个系统进行有效的展示，我们也提供了一个可观的合成活动信息的数据集，比如说数据集NASA里面就有二十万个活动片段，它们包括了300种不同活动类型和33种预先定义的活动属性。我们用NASA数据集来作为DAP3D-Net的训练集，并且用我们自己搜集的人类活动理解（HAU）数据集和公开的THUMOS数据集作为交叉验证。

最后的实验结果证明了我们的系统可以准确的从实际视频中识别，定位，分类和描述多个活动。

如果你对本文感兴趣，想要下载完整文章进行阅读，可以关注【泡泡机器人SLAM】公众号（paopaorobot_slam）。

回复关键字“0046”，即可获取本文下载链接。

泡泡机器人SLAM的原创内容均由泡泡机器人的成员花费大量心血制作而成，希望大家珍惜我们的劳动成果，转载请务必注明出自【泡泡机器人SLAM】微信公众号，否则侵权必究！同时，我们也欢迎各位转载到自己的朋友圈，让更多的人能进入到SLAM这个领域中，让我们共同为推进中国的SLAM事业而努力！

商业合作及转载请联系liufuqiang_robot@hotmail.com

登录查看更多

0

相关内容

深度模型

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

3D目标检测进展综述

3D目标检测进展综述

专知会员服务

193+阅读 · 2020年4月24日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

【重庆大学】基于生成式对抗网络的推荐系统:一个问题驱动的视角

【重庆大学】基于生成式对抗网络的推荐系统:一个问题驱动的视角

专知会员服务

18+阅读 · 2020年3月15日

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

专知会员服务

78+阅读 · 2020年2月25日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

【泡泡一分钟】L2-Net：用深度学习方法设计块描述子（CVPR-30）

【泡泡一分钟】L2-Net：用深度学习方法设计块描述子（CVPR-30）

泡泡机器人SLAM

15+阅读 · 2018年1月21日

【泡泡一分钟】学习高分辨率的3D数据表示（CVPR-25）

【泡泡一分钟】学习高分辨率的3D数据表示（CVPR-25）

泡泡机器人SLAM

4+阅读 · 2017年12月11日

【泡泡一分钟】基于改良CNN监督模型的单目人体三维动作姿态估计(3dv-13)

【泡泡一分钟】基于改良CNN监督模型的单目人体三维动作姿态估计(3dv-13)

泡泡机器人SLAM

6+阅读 · 2017年12月8日

【泡泡一分钟】基于紧凑模型表示的三维重建（3dv-12）

【泡泡一分钟】基于紧凑模型表示的三维重建（3dv-12）

泡泡机器人SLAM

10+阅读 · 2017年12月7日

【泡泡一分钟】ScanNet：一个室内场景三维重建标注数据集(CVPR-22)

【泡泡一分钟】ScanNet：一个室内场景三维重建标注数据集(CVPR-22)

泡泡机器人SLAM

45+阅读 · 2017年11月30日

【泡泡一分钟】3DMatch：学习用于RGB-D重建的局部几何描述子（CVPR-19）

【泡泡一分钟】3DMatch：学习用于RGB-D重建的局部几何描述子（CVPR-19）

泡泡机器人SLAM

35+阅读 · 2017年11月27日

【泡泡一分钟】基于全局SFM的鲁棒初始化单目视觉SLAM（3DV-1）

【泡泡一分钟】基于全局SFM的鲁棒初始化单目视觉SLAM（3DV-1）

泡泡机器人SLAM

5+阅读 · 2017年11月16日

【泡泡一分钟】一种紧凑的三维重建模型表示方法（CVPR-15）

【泡泡一分钟】一种紧凑的三维重建模型表示方法（CVPR-15）

泡泡机器人SLAM

9+阅读 · 2017年11月12日

【泡泡一分钟】基于深度自编码的3D激光点云定位方法（CVPR-14）

【泡泡一分钟】基于深度自编码的3D激光点云定位方法（CVPR-14）

泡泡机器人SLAM

9+阅读 · 2017年11月4日

【泡泡一分钟】用于图像配准的级联Lucas-Kanade网络（CVPR-10）

【泡泡一分钟】用于图像配准的级联Lucas-Kanade网络（CVPR-10）

泡泡机器人SLAM

55+阅读 · 2017年10月31日

Towards High-Fidelity 3D Face Reconstruction from In-the-Wild Images Using Graph Convolutional Networks

Towards High-Fidelity 3D Face Reconstruction from In-the-Wild Images Using Graph Convolutional Networks

Arxiv

8+阅读 · 2020年3月12日

Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image

Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image

Arxiv

12+阅读 · 2020年2月27日

Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos

Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos

Arxiv

3+阅读 · 2019年7月11日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

4+阅读 · 2018年9月25日

Simultaneous Localization and Mapping (SLAM) using RTAB-MAP

Simultaneous Localization and Mapping (SLAM) using RTAB-MAP

Arxiv

7+阅读 · 2018年9月9日

Fine-grained Video Classification and Captioning

Arxiv

7+阅读 · 2018年4月24日

Bidirectional Attentive Fusion with Context Gating for Dense Video Captioning

Arxiv

5+阅读 · 2018年4月3日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

Reconstruction Network for Video Captioning

Arxiv

5+阅读 · 2018年3月30日

CNN-RNN: A Unified Framework for Multi-label Image Classification

Arxiv

7+阅读 · 2016年4月15日

VIP会员

相关主题

长短期记忆

相关VIP内容

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

3D目标检测进展综述

3D目标检测进展综述

专知会员服务

193+阅读 · 2020年4月24日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

【重庆大学】基于生成式对抗网络的推荐系统:一个问题驱动的视角

【重庆大学】基于生成式对抗网络的推荐系统:一个问题驱动的视角

专知会员服务

18+阅读 · 2020年3月15日

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

专知会员服务

78+阅读 · 2020年2月25日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

【泡泡一分钟】L2-Net：用深度学习方法设计块描述子（CVPR-30）

【泡泡一分钟】L2-Net：用深度学习方法设计块描述子（CVPR-30）

泡泡机器人SLAM

15+阅读 · 2018年1月21日

【泡泡一分钟】学习高分辨率的3D数据表示（CVPR-25）

【泡泡一分钟】学习高分辨率的3D数据表示（CVPR-25）

泡泡机器人SLAM

4+阅读 · 2017年12月11日

【泡泡一分钟】基于改良CNN监督模型的单目人体三维动作姿态估计(3dv-13)

【泡泡一分钟】基于改良CNN监督模型的单目人体三维动作姿态估计(3dv-13)

泡泡机器人SLAM

6+阅读 · 2017年12月8日

【泡泡一分钟】基于紧凑模型表示的三维重建（3dv-12）

【泡泡一分钟】基于紧凑模型表示的三维重建（3dv-12）

泡泡机器人SLAM

10+阅读 · 2017年12月7日

【泡泡一分钟】ScanNet：一个室内场景三维重建标注数据集(CVPR-22)

【泡泡一分钟】ScanNet：一个室内场景三维重建标注数据集(CVPR-22)

泡泡机器人SLAM

45+阅读 · 2017年11月30日

【泡泡一分钟】3DMatch：学习用于RGB-D重建的局部几何描述子（CVPR-19）

【泡泡一分钟】3DMatch：学习用于RGB-D重建的局部几何描述子（CVPR-19）

泡泡机器人SLAM

35+阅读 · 2017年11月27日

【泡泡一分钟】基于全局SFM的鲁棒初始化单目视觉SLAM（3DV-1）

【泡泡一分钟】基于全局SFM的鲁棒初始化单目视觉SLAM（3DV-1）

泡泡机器人SLAM

5+阅读 · 2017年11月16日

【泡泡一分钟】一种紧凑的三维重建模型表示方法（CVPR-15）

【泡泡一分钟】一种紧凑的三维重建模型表示方法（CVPR-15）

泡泡机器人SLAM

9+阅读 · 2017年11月12日

【泡泡一分钟】基于深度自编码的3D激光点云定位方法（CVPR-14）

【泡泡一分钟】基于深度自编码的3D激光点云定位方法（CVPR-14）

泡泡机器人SLAM

9+阅读 · 2017年11月4日

【泡泡一分钟】用于图像配准的级联Lucas-Kanade网络（CVPR-10）

【泡泡一分钟】用于图像配准的级联Lucas-Kanade网络（CVPR-10）

泡泡机器人SLAM

55+阅读 · 2017年10月31日

相关论文

Towards High-Fidelity 3D Face Reconstruction from In-the-Wild Images Using Graph Convolutional Networks

Towards High-Fidelity 3D Face Reconstruction from In-the-Wild Images Using Graph Convolutional Networks

Arxiv

8+阅读 · 2020年3月12日

Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image

Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image

Arxiv

12+阅读 · 2020年2月27日

Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos

Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos

Arxiv

3+阅读 · 2019年7月11日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

4+阅读 · 2018年9月25日

Simultaneous Localization and Mapping (SLAM) using RTAB-MAP

Simultaneous Localization and Mapping (SLAM) using RTAB-MAP

Arxiv

7+阅读 · 2018年9月9日

Fine-grained Video Classification and Captioning

Arxiv

7+阅读 · 2018年4月24日

Bidirectional Attentive Fusion with Context Gating for Dense Video Captioning

Arxiv

5+阅读 · 2018年4月3日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

Reconstruction Network for Video Captioning

Arxiv

5+阅读 · 2018年3月30日

CNN-RNN: A Unified Framework for Multi-label Image Classification

Arxiv

7+阅读 · 2016年4月15日

大家都在搜

国防科技创新

大型语言模型

久别重逢话双塔

软件无线电

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员