会员服务 ·

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

2019 年 2 月 28 日 量子位

圆栗子发自凹非寺
量子位报道 | 公众号 QbitAI

中科大和微软亚洲研究院，发布了新的人体姿态估计模型，刷新了三项COCO纪录，还中选了CVPR 2019。

这个名叫HRNet的神经网络，拥有与众不同的并联结构，可以随时保持高分辨率表征，不只靠从低分辨率表征里，恢复高分辨率表征。

如此一来，姿势识别的效果明显提升：

在COCO数据集的关键点检测、姿态估计、多人姿态估计这三项任务里，HRNet都超越了所有前辈。

更加优秀的是，团队已经把模型开源了。

结构不一样

HRNet，是高分辨率网络 (High-Resolution Net) 的缩写。

团队希望，在表征学习 (Representative Learning) 的整个过程中，都能保持高分辨率表征。

所以，他们为模型设计了并联结构，把不同分辨率的子网络，用新的方式连在一起：

△ 并联

对比一下，前辈们连接各种分辨率，常常是用简单的串联，不论由高到低，还是由低到高：

△ 串联

那么，仔细观察一下HRNet的并联网络。

它从一个高分辨率的子网络开始，慢慢加入分辨率由高到低的子网络。

特别之处在于，它不是依赖一个单独的、由低到高的上采样 (Upsampling) 步骤，粗暴地把低层、高层表征聚合到一起；

而是在整个过程中，不停地融合 (Fusion) 各种不同尺度的表征。

△ 交换单元

这里，团队用了交换单元 (Exchange Units) ，穿梭在不同的子网络之间：让每一个子网络，都能从其他子网络生产的表征里，获得信息。

这样不断进行下去，就能得到丰富的高分辨率表征了。

横扫各大数据集

团队先在COCO数据集的val2017验证集上，对比了HRNet和一众前辈的关键点检测表现。

结果是，在两种输入分辨率上，大模型HRNet-W48和小模型HRNet-W32，都刷新了COCO纪录。

其中，大模型在384 x 288的输入分辨率上，拿到了76.3的AP分。

然后，团队又在COCO的test-dev2017测试集上，为HRNet和其他选手举办了姿态估计比赛。

结果，大模型和小模型，也都刷新了COCO纪录。大模型的AP分达到了77.0。

另外，在多人姿态估计任务上，HRNet又超越了前辈们在COCO数据集上的成绩。

那么，其他数据集能难倒它么？

在MPII验证集、PoseTrack、ImageNet验证集上，HRNet的表现都好过所有同台的对手。

详细的成绩表，请从文底传送门前往。

开源啦

刷榜活动圆满结束。

团队把这个振奋人心的模型开了源，是用PyTorch实现的。

除了估计姿势，这个方法也可以做语义分割，人脸对齐，物体检测，等等等等。

所以，你也去试一试吧。

论文传送门：
https://arxiv.org/abs/1902.09212

代码传送门：
https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

— 完 —

加入社群

量子位现开放「AI+行业」社群，面向AI行业相关从业者，技术、产品等人员，根据所在行业可选择相应行业社群，在量子位公众号（QbitAI）对话界面回复关键词“行业群”，获取入群方式。行业群会有审核，敬请谅解。

此外，量子位AI社群正在招募，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式。

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

登录查看更多

相关内容

HRNet

关注 0

【CMU】基于图神经网络的联合检测与多目标跟踪

专知会员服务

58+阅读 · 2020年6月24日

CVPR2020 | 商汤-港中文等提出PV-RCNN：3D目标检测新网络

专知会员服务

45+阅读 · 2020年4月17日

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

专知会员服务

31+阅读 · 2020年4月6日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【北京大学】CVPR 2020 | PQ-NET：序列化的三维形状生成网络

专知会员服务

10+阅读 · 2020年3月20日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

专知会员服务

37+阅读 · 2020年1月10日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

专知会员服务

27+阅读 · 2019年11月24日

加盟依图科技后，颜水成首篇顶会论文提出“高效多人体姿态检测SPM”

量子位

5+阅读 · 2019年9月16日

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

微软研究院AI头条

14+阅读 · 2019年5月21日

CVPR 2019 | 中科大 & 微软开源：基于高清表示网络的人体姿态估计

PaperWeekly

5+阅读 · 2019年5月10日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

【干货】CVPR2019 论文解读汇总（包括目标检测、姿态估计、语义分割等）

GAN生成式对抗网络

46+阅读 · 2019年3月11日

CVPR2019 论文解读汇总（包括目标检测、姿态估计、语义分割等，更新中）

极市平台

12+阅读 · 2019年3月11日

性能超越何恺明Mask R-CNN！华科硕士生开源图像分割新方法 | CVPR19 Oral

量子位

4+阅读 · 2019年3月5日

CVPR2019|微软、中科大开源基于深度高分辨表示学习的姿态估计算法

AI100

6+阅读 · 2019年3月2日

【姿态估计比Mask-RCNN提高8%】上交卢策吾团队开源AlphaPose

上海交大机器视觉与智能实验室

9+阅读 · 2018年2月4日

报名 | 旷视研究院解读COCO2017人体姿态估计竞赛冠军论文

量子位

4+阅读 · 2017年12月7日

Simple Multi-Resolution Representation Learning for Human Pose Estimation

Arxiv

6+阅读 · 2020年4月14日

FoveaBox: Beyond Anchor-based Object Detector

Arxiv

5+阅读 · 2019年4月8日

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

Arxiv

6+阅读 · 2019年2月25日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

Multi-scale Location-aware Kernel Representation for Object Detection

Arxiv

5+阅读 · 2018年4月2日

Deep contextualized word representations

Arxiv

10+阅读 · 2018年3月22日

Revisiting Salient Object Detection: Simultaneous Detection, Ranking, and Subitizing of Multiple Salient Objects

Arxiv

11+阅读 · 2018年3月14日

Salient Object Detection by Lossless Feature Reflection

Arxiv

4+阅读 · 2018年2月19日

Mask R-CNN

Arxiv

7+阅读 · 2018年1月24日

MSDNN: Multi-Scale Deep Neural Network for Salient Object Detection

Arxiv

21+阅读 · 2018年1月12日

VIP会员

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

圆栗子 发自 凹非寺 量子位 报道 | 公众号 QbitAI

结构不一样

△ 并联

△ 串联

△ 交换单元

横扫各大数据集

开源啦

相关内容

圆栗子发自凹非寺
量子位报道 | 公众号 QbitAI