CVPR2019 | 西北工业大学开源拥挤人群数据集生成工具,大幅提升算法精度

2019 年 3 月 14 日 极市平台

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流点击文末“阅读原文”立刻申请入群~


来源:我爱计算机视觉

授权转自我爱计算机视觉,未经允许不得二次转载


近年来,因为拥挤人群计数在视频监控、公共安全方面的应用广泛,引起了不少学者的关注。


简单说来这个任务就是给定图像,返回该图像所描述场景中有多少人。

这可以帮助城市管理者、大型活动组织方实时了解人群拥挤情况,以利于早期防范群体事件、人群踩踏等。


和大多数计算机视觉任务面临相同的困境,视频数据容易获取,但标注却是个耗费大量人力物力的工作。


最近新上传到arXiv 的 CVPR 2019 的接收论文《Learning from Synthetic Data for Crowd Counting in the Wild》,来自西北工业大学的学者提出使用计算机图形工具创建拥挤人群数据集的方法,并开源了他们创建的大型数据集,在此数据集上训练的算法精度获得了大幅提升,超越了之前的state-of-the-art。


作者信息:



作者全部来自西北工业大学。


作者使用计算机图形学的方法,通过设置不同的多样化的场景、设置不同的人物模型,创建了大量的样本数据。



下图是与现有数据集的比较,可见该论文中提出的GCC数据集是目前最大的公开数据集。



同时,该数据集在每幅图像中行人个数、时间分布、天气情况分布各个方面也具有多样性,非常适合人群计数任务。



如何用这个数据集?


该数据集是合成数据集,作者提出两种方法,使用该数据集参与算法训练。


如下图,上面部分为监督学习方法,下面部分为使用域适应的方法。



一种是监督学习的方法,使用该大型数据集预训练网络,再在实际的真实场景数据集中微调网络。


使用这种方法,作者采用的网络模型:

获得了超越目前该任务state-of-the-art的精度。




使用域适应方法的算法流程图:



使用该数据集后,算法同样获得了大幅的精度提升。



作者已经公开了该数据集,并开源了数据创建标注工具。

https://github.com/gjy3035/GCC-CL

项目主页:

https://gjy3035.github.io/GCC-CL/

论文地址:

https://arxiv.org/pdf/1903.03303.pdf


感谢各位作者!


下面来看看作者放出的数据创建Demo视频:


对于做相关方法的朋友,非常值得参考!


ps.CVPR2019 accepted list已经放出,极市已将目前收集到的公开论文总结到github上(目前已收集179篇),后续会不断更新,欢迎关注,也欢迎大家提交自己的论文:

https://github.com/extreme-assistant/cvpr2019




*延伸阅读

【技术短文】基于深度负相关学习的人群计数方法

CVPR2019 | 业内最大规模!美图联合清华推出教程类行为数据集 COIN


小Tips:如何查看和检索历史文章?

有不少小伙伴提问如何号内搜文章,其实很简单,在“极市平台”公众号后台菜单点击极市干货-历史文章,或直接搜索“极市平台”公众号查看全部消息,即可在如下搜索框查找往期文章哦~



ps.可以输入CVPR2019/目标检测/语义分割等等,快去探索宝藏吧~~



点击左下角阅读原文”,即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群,更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流,一起来让思想之光照的更远吧~



觉得有用麻烦给个好看啦~  

登录查看更多
9

相关内容

【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
25+阅读 · 2020年5月25日
Capsule Networks,胶囊网络,57页ppt,布法罗大学
专知会员服务
65+阅读 · 2020年2月29日
数据标注研究综述,软件学报,19页pdf
专知会员服务
86+阅读 · 2020年2月20日
【论文推荐】小样本视频合成,Few-shot Video-to-Video Synthesis
专知会员服务
23+阅读 · 2019年12月15日
汇总 | SLAM、重建、语义相关数据集大全
计算机视觉life
5+阅读 · 2019年5月29日
资源 | 一份非常全面的开源数据集
黑龙江大学自然语言处理实验室
10+阅读 · 2018年9月7日
AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning
W-net: Bridged U-net for 2D Medical Image Segmentation
Arxiv
19+阅读 · 2018年7月12日
VIP会员
Top
微信扫码咨询专知VIP会员