会员服务 ·

0

CVPR2019 | 西北工业大学开源拥挤人群数据集生成工具，大幅提升算法精度

2019 年 3 月 14 日 极市平台

加入极市专业CV交流群，与6000+来自腾讯，华为，百度，北大，清华，中科院等名企名校视觉开发者互动交流！更有机会与李开复老师等大牛群内互动！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。点击文末“阅读原文”立刻申请入群~

来源：我爱计算机视觉

授权转自我爱计算机视觉，未经允许不得二次转载

近年来，因为拥挤人群计数在视频监控、公共安全方面的应用广泛，引起了不少学者的关注。

简单说来这个任务就是给定图像，返回该图像所描述场景中有多少人。

这可以帮助城市管理者、大型活动组织方实时了解人群拥挤情况，以利于早期防范群体事件、人群踩踏等。

和大多数计算机视觉任务面临相同的困境，视频数据容易获取，但标注却是个耗费大量人力物力的工作。

最近新上传到arXiv 的 CVPR 2019 的接收论文《Learning from Synthetic Data for Crowd Counting in the Wild》，来自西北工业大学的学者提出使用计算机图形工具创建拥挤人群数据集的方法，并开源了他们创建的大型数据集，在此数据集上训练的算法精度获得了大幅提升，超越了之前的state-of-the-art。

作者信息：

作者全部来自西北工业大学。

作者使用计算机图形学的方法，通过设置不同的多样化的场景、设置不同的人物模型，创建了大量的样本数据。

下图是与现有数据集的比较，可见该论文中提出的GCC数据集是目前最大的公开数据集。

同时，该数据集在每幅图像中行人个数、时间分布、天气情况分布各个方面也具有多样性，非常适合人群计数任务。

如何用这个数据集？

该数据集是合成数据集，作者提出两种方法，使用该数据集参与算法训练。

如下图，上面部分为监督学习方法，下面部分为使用域适应的方法。

一种是监督学习的方法，使用该大型数据集预训练网络，再在实际的真实场景数据集中微调网络。

使用这种方法，作者采用的网络模型：

获得了超越目前该任务state-of-the-art的精度。

使用域适应方法的算法流程图：

使用该数据集后，算法同样获得了大幅的精度提升。

作者已经公开了该数据集，并开源了数据创建标注工具。

https://github.com/gjy3035/GCC-CL

项目主页：

https://gjy3035.github.io/GCC-CL/

论文地址：

https://arxiv.org/pdf/1903.03303.pdf

感谢各位作者！

下面来看看作者放出的数据创建Demo视频：

对于做相关方法的朋友，非常值得参考！

ps.CVPR2019 accepted list已经放出，极市已将目前收集到的公开论文总结到github上（目前已收集179篇），后续会不断更新，欢迎关注，也欢迎大家提交自己的论文：

https://github.com/extreme-assistant/cvpr2019

*延伸阅读

【技术短文】基于深度负相关学习的人群计数方法

CVPR2019 | 业内最大规模！美图联合清华推出教程类行为数据集 COIN

小Tips：如何查看和检索历史文章？

有不少小伙伴提问如何号内搜文章，其实很简单，在“极市平台”公众号后台菜单点击极市干货-历史文章，或直接搜索“极市平台”公众号查看全部消息，即可在如下搜索框查找往期文章哦~

ps.可以输入CVPR2019/目标检测/语义分割等等，快去探索宝藏吧~~

点击左下角“阅读原文”，即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群，更有每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流，一起来让思想之光照的更远吧~

觉得有用麻烦给个好看啦~

登录查看更多

9

相关内容

CVPR2019

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

【综述】面向视觉智能的知识蒸馏和Student-Teacher方法，附37页pdf下载

【综述】面向视觉智能的知识蒸馏和Student-Teacher方法，附37页pdf下载

专知会员服务

68+阅读 · 2020年4月16日

北航发布「深度学习人群计数」2020综述论文，220+基于CNN的密度估计和人群计数的方法大调研

北航发布「深度学习人群计数」2020综述论文，220+基于CNN的密度估计和人群计数的方法大调研

专知会员服务

41+阅读 · 2020年4月1日

【滑铁卢大学】新冠肺炎网络COVID-Net:一种定制的深卷积神经网络设计，用于从胸片图像中检测COVID-19

【滑铁卢大学】新冠肺炎网络COVID-Net:一种定制的深卷积神经网络设计，用于从胸片图像中检测COVID-19

专知会员服务

35+阅读 · 2020年3月25日

Capsule Networks，胶囊网络，57页ppt，布法罗大学

Capsule Networks，胶囊网络，57页ppt，布法罗大学

专知会员服务

69+阅读 · 2020年2月29日

数据标注研究综述，软件学报，19页pdf

数据标注研究综述，软件学报，19页pdf

专知会员服务

95+阅读 · 2020年2月20日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

专知会员服务

32+阅读 · 2019年11月8日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知会员服务

80+阅读 · 2019年10月12日

CVPR 2019 | 国防科大提出双目超分辨算法，效果优异代码已开源

CVPR 2019 | 国防科大提出双目超分辨算法，效果优异代码已开源

极市平台

19+阅读 · 2019年6月8日

汇总 | SLAM、重建、语义相关数据集大全

汇总 | SLAM、重建、语义相关数据集大全

计算机视觉life

5+阅读 · 2019年5月29日

CVPR2019| 05-08更新12篇论文及代码合集（1篇oral，含医学图像分割/显著性检测/数据集等）

CVPR2019| 05-08更新12篇论文及代码合集（1篇oral，含医学图像分割/显著性检测/数据集等）

极市平台

19+阅读 · 2019年5月8日

多伦多大学&NVIDIA最新成果：图像标注速度提升10倍！

多伦多大学&NVIDIA最新成果：图像标注速度提升10倍！

极市平台

6+阅读 · 2019年4月10日

人群计数最全代码、数据、论文合集（含最新CVPR2019论文）

人群计数最全代码、数据、论文合集（含最新CVPR2019论文）

极市平台

64+阅读 · 2019年3月14日

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

AI100

14+阅读 · 2019年3月9日

DeepFashion2数据集：87.3万对买家秀-卖家秀图像+海量标注

DeepFashion2数据集：87.3万对买家秀-卖家秀图像+海量标注

极市平台

5+阅读 · 2019年2月12日

资源 | 一份非常全面的开源数据集

资源 | 一份非常全面的开源数据集

黑龙江大学自然语言处理实验室

10+阅读 · 2018年9月7日

谷歌发布最大图像标注数据集，190 万张图片开启公开图像挑战赛

谷歌发布最大图像标注数据集，190 万张图片开启公开图像挑战赛

AI研习社

7+阅读 · 2018年5月1日

多目标跟踪突破：上交大&中兴 MOT Challenge 测评获第一

多目标跟踪突破：上交大&中兴 MOT Challenge 测评获第一

新智元

13+阅读 · 2017年8月5日

AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning

AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning

Arxiv

64+阅读 · 2020年2月28日

Unified Vision-Language Pre-Training for Image Captioning and VQA

Unified Vision-Language Pre-Training for Image Captioning and VQA

Arxiv

8+阅读 · 2019年10月3日

End-to-End Video Captioning with Multitask Reinforcement Learning

End-to-End Video Captioning with Multitask Reinforcement Learning

Arxiv

3+阅读 · 2019年1月1日

Monocular Total Capture: Posing Face, Body, and Hands in the Wild

Monocular Total Capture: Posing Face, Body, and Hands in the Wild

Arxiv

4+阅读 · 2018年12月4日

Learning to Generate and Reconstruct 3D Meshes with only 2D Supervision

Arxiv

3+阅读 · 2018年11月15日

A Fully Convolutional Two-Stream Fusion Network for Interactive Image Segmentation

Arxiv

3+阅读 · 2018年10月2日

Multi-Hop Knowledge Graph Reasoning with Reward Shaping

Arxiv

5+阅读 · 2018年9月11日

W-net: Bridged U-net for 2D Medical Image Segmentation

W-net: Bridged U-net for 2D Medical Image Segmentation

Arxiv

20+阅读 · 2018年7月12日

Bidirectional Attentive Fusion with Context Gating for Dense Video Captioning

Arxiv

5+阅读 · 2018年4月3日

Visual Question Answering with Memory-Augmented Networks

Arxiv

4+阅读 · 2018年3月25日

VIP会员

相关主题

计算机视觉

相关VIP内容

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

【综述】面向视觉智能的知识蒸馏和Student-Teacher方法，附37页pdf下载

【综述】面向视觉智能的知识蒸馏和Student-Teacher方法，附37页pdf下载

专知会员服务

68+阅读 · 2020年4月16日

北航发布「深度学习人群计数」2020综述论文，220+基于CNN的密度估计和人群计数的方法大调研

北航发布「深度学习人群计数」2020综述论文，220+基于CNN的密度估计和人群计数的方法大调研

专知会员服务

41+阅读 · 2020年4月1日

【滑铁卢大学】新冠肺炎网络COVID-Net:一种定制的深卷积神经网络设计，用于从胸片图像中检测COVID-19

【滑铁卢大学】新冠肺炎网络COVID-Net:一种定制的深卷积神经网络设计，用于从胸片图像中检测COVID-19

专知会员服务

35+阅读 · 2020年3月25日

Capsule Networks，胶囊网络，57页ppt，布法罗大学

Capsule Networks，胶囊网络，57页ppt，布法罗大学

专知会员服务

69+阅读 · 2020年2月29日

数据标注研究综述，软件学报，19页pdf

数据标注研究综述，软件学报，19页pdf

专知会员服务

95+阅读 · 2020年2月20日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

【CCF优秀博士学位论文奖-2019提名】大规模图数据查询处理关键技术研究，东北大学成雨蓉

专知会员服务

32+阅读 · 2019年11月8日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知会员服务

80+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

网络科学赋能人工智能: 现状与展望

【NeurIPS2025教程】解释人工智能模型：可解释人工智能、数据中心人工智能与机制可解释性的方法与机遇

人工智能赋能作战行动：以俄乌战争为例

【ETHZ博士论文】表征学习在推进深度学习中的作用：效率、可扩展性与推理

相关资讯

CVPR 2019 | 国防科大提出双目超分辨算法，效果优异代码已开源

CVPR 2019 | 国防科大提出双目超分辨算法，效果优异代码已开源

极市平台

19+阅读 · 2019年6月8日

汇总 | SLAM、重建、语义相关数据集大全

汇总 | SLAM、重建、语义相关数据集大全

计算机视觉life

5+阅读 · 2019年5月29日

CVPR2019| 05-08更新12篇论文及代码合集（1篇oral，含医学图像分割/显著性检测/数据集等）

CVPR2019| 05-08更新12篇论文及代码合集（1篇oral，含医学图像分割/显著性检测/数据集等）

极市平台

19+阅读 · 2019年5月8日

多伦多大学&NVIDIA最新成果：图像标注速度提升10倍！

多伦多大学&NVIDIA最新成果：图像标注速度提升10倍！

极市平台

6+阅读 · 2019年4月10日

人群计数最全代码、数据、论文合集（含最新CVPR2019论文）

人群计数最全代码、数据、论文合集（含最新CVPR2019论文）

极市平台

64+阅读 · 2019年3月14日

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

AI100

14+阅读 · 2019年3月9日

DeepFashion2数据集：87.3万对买家秀-卖家秀图像+海量标注

DeepFashion2数据集：87.3万对买家秀-卖家秀图像+海量标注

极市平台

5+阅读 · 2019年2月12日

资源 | 一份非常全面的开源数据集

资源 | 一份非常全面的开源数据集

黑龙江大学自然语言处理实验室

10+阅读 · 2018年9月7日

谷歌发布最大图像标注数据集，190 万张图片开启公开图像挑战赛

谷歌发布最大图像标注数据集，190 万张图片开启公开图像挑战赛

AI研习社

7+阅读 · 2018年5月1日

多目标跟踪突破：上交大&中兴 MOT Challenge 测评获第一

多目标跟踪突破：上交大&中兴 MOT Challenge 测评获第一

新智元

13+阅读 · 2017年8月5日

相关论文

AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning

AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning

Arxiv

64+阅读 · 2020年2月28日

Unified Vision-Language Pre-Training for Image Captioning and VQA

Unified Vision-Language Pre-Training for Image Captioning and VQA

Arxiv

8+阅读 · 2019年10月3日

End-to-End Video Captioning with Multitask Reinforcement Learning

End-to-End Video Captioning with Multitask Reinforcement Learning

Arxiv

3+阅读 · 2019年1月1日

Monocular Total Capture: Posing Face, Body, and Hands in the Wild

Monocular Total Capture: Posing Face, Body, and Hands in the Wild

Arxiv

4+阅读 · 2018年12月4日

Learning to Generate and Reconstruct 3D Meshes with only 2D Supervision

Arxiv

3+阅读 · 2018年11月15日

A Fully Convolutional Two-Stream Fusion Network for Interactive Image Segmentation

Arxiv

3+阅读 · 2018年10月2日

Multi-Hop Knowledge Graph Reasoning with Reward Shaping

Arxiv

5+阅读 · 2018年9月11日

W-net: Bridged U-net for 2D Medical Image Segmentation

W-net: Bridged U-net for 2D Medical Image Segmentation

Arxiv

20+阅读 · 2018年7月12日

Bidirectional Attentive Fusion with Context Gating for Dense Video Captioning

Arxiv

5+阅读 · 2018年4月3日

Visual Question Answering with Memory-Augmented Networks

Arxiv

4+阅读 · 2018年3月25日

大家都在搜

大型语言模型

生成式人工智能

无人机系统

朱克爱德华兹家族

蓝牙安全攻防

精排模型-从MLP到行为序列：DIN、DIEN、MIMN、SIM、DSIN

微信扫码咨询专知VIP会员