面向智能视频监控系统中目标理解的长时程深度学习模型研究 - 专知基金

会员服务 ·

0

视频语义理解 · 深度学习 · 长时程 · 深度混合神经网络 · 目标识别 ·

2014 年 12 月 31 日

面向智能视频监控系统中目标理解的长时程深度学习模型研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 面向智能视频监控系统中目标理解的长时程深度学习模型研究

项目编号： No.61471206

项目类型： 面上项目

立项/批准年度： 2015

项目学科： 无线电电子学、电信技术

项目作者： 孙宁

作者单位： 南京邮电大学

项目金额： 81万元

中文摘要： 基于视频的目标理解，是对视频中目标属性和目标行为在语义层次上的描述，是视频监控系统智能化应用的重要体现。由于采集视角，目标姿态，光照条件等方面差异，加上之前目标检测和目标跟踪处理带入的误差等因素的影响，基于短时程图像序列的分析算法很难在实际条件下进行准确和稳定的目标理解。针对上述问题，本项目以深度学习理论为基础，从长时程图像序列中目标的时空相关特性出发，将卷积神经网络(CNN)和深度置信网络(DBN)进行融合，建立长时程深度混合神经网络(LDHNN)模型，利用CNN实现对三维图像序列数据的特征化和向量化，堆叠DBN来加深网络的层次，提升网络对目标长时程时空特征的学习能力。基于逐网络逐层的思想，推导LDHNN的训练算法，并利用多GPU并行运算来大幅加速训练过程，实现基于LDHNN的目标理解功能，为研究面向长时程图像序列的深度学习模型，提升现有视频监控系统的智能化应用探索一条有效的技术途径。

中文关键词： 视频语义理解；深度学习；长时程；深度混合神经网络；目标识别

英文摘要： Object understanding based on video, which is the semantic description of target attribute and behavior, and is an important embodiment of intelligent video surveillance system application. As the impact of video resolution, viewing angle, target poses and illumination dynamic, as well as the error of previous target detection and target tracking, the short-term image sequences based algorithm is unable to understand the object precisely and stably. In this project, a Long-term Deep Hybrid Neural Networks (LDHNN) model will be built with Convolution Neural Networks (CNN) and the Deep Belief Networks (DBN) based on the theory of deep learning and the principal of target spatial-temporal correlation in long-term image sequences. In the model of LDHNN, 3D image sequences are mapped to 1D feature vectors by CNN, and the stacked DBN deepen the level of entire networks. The network-wise and layer-wise training procedure of LDHNN can be accelerated obviously by parallel computing using multiple GPUs. It will provide the theoretical and technological support for long-term object understanding in video surveillance system.

英文关键词： video understanding;deep learning;long-term;deep hybrid neural network;object recognition

成为VIP会员查看完整内容

0

相关内容

视频语义理解

视频语义理解

TPAMI 2021｜VideoDG:首个视频领域泛化模型

TPAMI 2021｜VideoDG:首个视频领域泛化模型

专知会员服务

21+阅读 · 2021年12月31日

智能视频监控关键技术:行人再识别研究综述

智能视频监控关键技术:行人再识别研究综述

专知会员服务

40+阅读 · 2021年12月30日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

22+阅读 · 2021年10月9日

基于深度学习的通用目标检测研究综述

专知会员服务

93+阅读 · 2021年8月29日

基于深度学习的视频目标检测综述

基于深度学习的视频目标检测综述

专知会员服务

84+阅读 · 2021年5月19日

视频分析中的人工智能 (AI)白皮书，16页pdf

视频分析中的人工智能 (AI)白皮书，16页pdf

专知会员服务

68+阅读 · 2021年5月6日

面向自动驾驶的边缘计算技术研究综述

专知会员服务

66+阅读 · 2021年5月3日

基于深度学习的小目标检测方法综述

专知会员服务

125+阅读 · 2021年4月29日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

《信息技术人工智能面向机器学习的系统框架和功能要求》团体标准，11页pdf

《信息技术人工智能面向机器学习的系统框架和功能要求》团体标准，11页pdf

专知

9+阅读 · 2022年3月2日

智能视频监控关键技术:行人再识别研究综述

智能视频监控关键技术:行人再识别研究综述

专知

3+阅读 · 2021年12月30日

面向自动驾驶的边缘计算技术研究综述

面向自动驾驶的边缘计算技术研究综述

专知

4+阅读 · 2021年5月3日

基于深度学习的小目标检测方法综述

基于深度学习的小目标检测方法综述

专知

3+阅读 · 2021年4月29日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

基于深度学习的视频目标检测综述

基于深度学习的视频目标检测综述

极市平台

16+阅读 · 2019年7月19日

视频大脑：视频内容理解的技术与应用

视频大脑：视频内容理解的技术与应用

AI前线

13+阅读 · 2019年4月18日

综述 | 近5年基于深度学习的目标检测算法

综述 | 近5年基于深度学习的目标检测算法

计算机视觉life

38+阅读 · 2019年4月18日

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

人工智能前沿讲习班

12+阅读 · 2018年12月25日

基于视频的目标检测的发展【附PPT与视频资料】

基于视频的目标检测的发展【附PPT与视频资料】

人工智能前沿讲习班

19+阅读 · 2018年12月14日

协同视频监控中的行人再辨识关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

面向智能视觉监控的大规模慢特征学习研究

国家自然科学基金

3+阅读 · 2014年12月31日

目标协同分割与识别技术的研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向多源遥感图像的深度学习技术与系统研究

国家自然科学基金

17+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度信息和深度学习的车载视觉行人检测方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于深度学习的协同目标分割与行为理解研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于图模型与增量学习的网络化智能视频监控研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向智能视频监控的多目标检测与跟踪技术研究

国家自然科学基金

4+阅读 · 2012年12月31日

面向智能视频监控的高度多摄像机信息融合

国家自然科学基金

2+阅读 · 2009年12月31日

How to design a network architecture using capacity planning

Arxiv

0+阅读 · 2022年4月20日

Two-Stream Graph Convolutional Network for Intra-oral Scanner Image Segmentation

Arxiv

0+阅读 · 2022年4月19日

Poisons that are learned faster are more effective

Arxiv

0+阅读 · 2022年4月19日

Sardino: Ultra-Fast Dynamic Ensemble for Secure Visual Sensing at Mobile Edge

Arxiv

0+阅读 · 2022年4月18日

An Extendable, Efficient and Effective Transformer-based Object Detector

Arxiv

0+阅读 · 2022年4月17日

Constructing Open Cloze Tests Using Generation and Discrimination Capabilities of Transformers

Arxiv

0+阅读 · 2022年4月14日

Feature Decomposition and Reconstruction Learning for Effective Facial Expression Recognition

Arxiv

15+阅读 · 2021年4月12日

Unsupervised Domain Clusters in Pretrained Language Models

Arxiv

11+阅读 · 2020年4月5日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

Mobile Video Object Detection with Temporally-Aware Feature Maps

Arxiv

11+阅读 · 2018年3月28日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

视频语义理解

深度混合神经网络

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型时代的文档智能：综述

蜂窝通信是否是无人机与无人地面战车主宰战场的关键？

文档视觉问答简述

最新新Agent综述！76页327篇论文梳理，北交大桑基韬教授团队发布《迈向模型原生智能体式人工智能的范式转变综述》

相关VIP内容

TPAMI 2021｜VideoDG:首个视频领域泛化模型

TPAMI 2021｜VideoDG:首个视频领域泛化模型

专知会员服务

21+阅读 · 2021年12月31日

智能视频监控关键技术:行人再识别研究综述

智能视频监控关键技术:行人再识别研究综述

专知会员服务

40+阅读 · 2021年12月30日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

22+阅读 · 2021年10月9日

基于深度学习的通用目标检测研究综述

专知会员服务

93+阅读 · 2021年8月29日

基于深度学习的视频目标检测综述

基于深度学习的视频目标检测综述

专知会员服务

84+阅读 · 2021年5月19日

视频分析中的人工智能 (AI)白皮书，16页pdf

视频分析中的人工智能 (AI)白皮书，16页pdf

专知会员服务

68+阅读 · 2021年5月6日

面向自动驾驶的边缘计算技术研究综述

专知会员服务

66+阅读 · 2021年5月3日

基于深度学习的小目标检测方法综述

专知会员服务

125+阅读 · 2021年4月29日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

相关资讯

《信息技术人工智能面向机器学习的系统框架和功能要求》团体标准，11页pdf

《信息技术人工智能面向机器学习的系统框架和功能要求》团体标准，11页pdf

专知

9+阅读 · 2022年3月2日

智能视频监控关键技术:行人再识别研究综述

智能视频监控关键技术:行人再识别研究综述

专知

3+阅读 · 2021年12月30日

面向自动驾驶的边缘计算技术研究综述

面向自动驾驶的边缘计算技术研究综述

专知

4+阅读 · 2021年5月3日

基于深度学习的小目标检测方法综述

基于深度学习的小目标检测方法综述

专知

3+阅读 · 2021年4月29日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

基于深度学习的视频目标检测综述

基于深度学习的视频目标检测综述

极市平台

16+阅读 · 2019年7月19日

视频大脑：视频内容理解的技术与应用

视频大脑：视频内容理解的技术与应用

AI前线

13+阅读 · 2019年4月18日

综述 | 近5年基于深度学习的目标检测算法

综述 | 近5年基于深度学习的目标检测算法

计算机视觉life

38+阅读 · 2019年4月18日

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

人工智能前沿讲习班

12+阅读 · 2018年12月25日

基于视频的目标检测的发展【附PPT与视频资料】

基于视频的目标检测的发展【附PPT与视频资料】

人工智能前沿讲习班

19+阅读 · 2018年12月14日

相关基金

协同视频监控中的行人再辨识关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

面向智能视觉监控的大规模慢特征学习研究

国家自然科学基金

3+阅读 · 2014年12月31日

目标协同分割与识别技术的研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向多源遥感图像的深度学习技术与系统研究

国家自然科学基金

17+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度信息和深度学习的车载视觉行人检测方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于深度学习的协同目标分割与行为理解研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于图模型与增量学习的网络化智能视频监控研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向智能视频监控的多目标检测与跟踪技术研究

国家自然科学基金

4+阅读 · 2012年12月31日

面向智能视频监控的高度多摄像机信息融合

国家自然科学基金

2+阅读 · 2009年12月31日

相关论文

How to design a network architecture using capacity planning

Arxiv

0+阅读 · 2022年4月20日

Two-Stream Graph Convolutional Network for Intra-oral Scanner Image Segmentation

Arxiv

0+阅读 · 2022年4月19日

Poisons that are learned faster are more effective

Arxiv

0+阅读 · 2022年4月19日

Sardino: Ultra-Fast Dynamic Ensemble for Secure Visual Sensing at Mobile Edge

Arxiv

0+阅读 · 2022年4月18日

An Extendable, Efficient and Effective Transformer-based Object Detector

Arxiv

0+阅读 · 2022年4月17日

Constructing Open Cloze Tests Using Generation and Discrimination Capabilities of Transformers

Arxiv

0+阅读 · 2022年4月14日

Feature Decomposition and Reconstruction Learning for Effective Facial Expression Recognition

Arxiv

15+阅读 · 2021年4月12日

Unsupervised Domain Clusters in Pretrained Language Models

Arxiv

11+阅读 · 2020年4月5日

Self-Attention with Relative Position Representations

Arxiv

27+阅读 · 2018年4月12日

Mobile Video Object Detection with Temporally-Aware Feature Maps

Arxiv

11+阅读 · 2018年3月28日

微信扫码咨询专知VIP会员