会员服务 ·

CVPR2019 | 中科大&微软提出：姿态估计新模型HRNet（已开源）

2019 年 3 月 14 日 CVer

点击上方“CVer”，选择"星标"和“置顶”

重磅干货，第一时间送达

圆栗子发自凹非寺
转载自量子位(QbitAI)

中科大和微软亚洲研究院，发布了新的人体姿态估计模型，刷新了三项COCO纪录，还中选了CVPR 2019。

这个名叫HRNet的神经网络，拥有与众不同的并联结构，可以随时保持高分辨率表征，不只靠从低分辨率表征里，恢复高分辨率表征。

如此一来，姿势识别的效果明显提升：

在COCO数据集的关键点检测、姿态估计、多人姿态估计这三项任务里，HRNet都超越了所有前辈。

更加优秀的是，团队已经把模型开源了。

结构不一样

HRNet，是高分辨率网络 (High-Resolution Net) 的缩写。

团队希望，在表征学习 (Representative Learning) 的整个过程中，都能保持高分辨率表征。

所以，他们为模型设计了并联结构，把不同分辨率的子网络，用新的方式连在一起：

△ 并联

对比一下，前辈们连接各种分辨率，常常是用简单的串联，不论由高到低，还是由低到高：

△ 串联

那么，仔细观察一下HRNet的并联网络。

它从一个高分辨率的子网络开始，慢慢加入分辨率由高到低的子网络。

特别之处在于，它不是依赖一个单独的、由低到高的上采样 (Upsampling) 步骤，粗暴地把低层、高层表征聚合到一起；

而是在整个过程中，不停地融合 (Fusion) 各种不同尺度的表征。

△ 交换单元

这里，团队用了交换单元 (Exchange Units) ，穿梭在不同的子网络之间：让每一个子网络，都能从其他子网络生产的表征里，获得信息。

这样不断进行下去，就能得到丰富的高分辨率表征了。

横扫各大数据集

团队先在COCO数据集的val2017验证集上，对比了HRNet和一众前辈的关键点检测表现。

结果是，在两种输入分辨率上，大模型HRNet-W48和小模型HRNet-W32，都刷新了COCO纪录。

其中，大模型在384 x 288的输入分辨率上，拿到了76.3的AP分。

然后，团队又在COCO的test-dev2017测试集上，为HRNet和其他选手举办了姿态估计比赛。

结果，大模型和小模型，也都刷新了COCO纪录。大模型的AP分达到了77.0。

另外，在多人姿态估计任务上，HRNet又超越了前辈们在COCO数据集上的成绩。

那么，其他数据集能难倒它么？

在MPII验证集、PoseTrack、ImageNet验证集上，HRNet的表现都好过所有同台的对手。

详细的成绩表，请从文底传送门前往。

开源啦

刷榜活动圆满结束。

团队把这个振奋人心的模型开了源，是用PyTorch实现的。

除了估计姿势，这个方法也可以做语义分割，人脸对齐，物体检测，等等等等。

所以，你也去试一试吧。

论文传送门：
https://arxiv.org/abs/1902.09212

代码传送门：
https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

CVer姿态估计群

扫码添加CVer助手，可申请加入CVer-姿态估计群。一定要备注：姿态估计+地点+学校/公司+昵称

▲长按加群

这么硬的论文速递，麻烦给我一个好看

▲长按关注我们

麻烦给我一个好看！

登录查看更多

相关内容

HRNet

关注 0

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

专知会员服务

31+阅读 · 2020年4月6日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【ICLR2020-谷歌】用“复合散度”量化模型合成泛化能力

专知会员服务

20+阅读 · 2020年3月29日

[CVPR 2020 Oral-牛津] RandLA-Net:大场景三维点云语义分割新框架

专知会员服务

26+阅读 · 2020年3月15日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

抢鲜看！13篇CVPR2020论文链接/开源代码/解读

专知会员服务

50+阅读 · 2020年2月26日

【快讯】CVPR2020结果出炉，1470篇上榜，你的paper中了吗？

专知会员服务

51+阅读 · 2020年2月24日

【ICLR2020】胶囊与反向路由点积注意力

专知会员服务

27+阅读 · 2020年2月15日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

专知会员服务

27+阅读 · 2019年11月24日

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

微软研究院AI头条

14+阅读 · 2019年5月21日

精度高、模型小、速度快！梯形DenseNets结构实现语义分割新高度！

计算机视觉life

5+阅读 · 2019年5月18日

CVPR 2019 | 中科大 & 微软开源：基于高清表示网络的人体姿态估计

PaperWeekly

5+阅读 · 2019年5月10日

本周精选共读论文《姿态估计&图像生成》五篇

人工智能前沿讲习班

7+阅读 · 2019年3月25日

【干货】CVPR2019 论文解读汇总（包括目标检测、姿态估计、语义分割等）

GAN生成式对抗网络

46+阅读 · 2019年3月11日

CVPR2019 论文解读汇总（包括目标检测、姿态估计、语义分割等，更新中）

极市平台

12+阅读 · 2019年3月11日

性能超越何恺明Mask R-CNN！华科硕士生开源图像分割新方法 | CVPR19 Oral

量子位

4+阅读 · 2019年3月5日

CVPR2019|微软、中科大开源基于深度高分辨表示学习的姿态估计算法

AI100

6+阅读 · 2019年3月2日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

电子科大提出 “姿态蒸馏” 算法-实现快速人体姿态估计

极市平台

4+阅读 · 2018年11月16日

Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

Arxiv

17+阅读 · 2020年3月31日

MetaFuse: A Pre-trained Fusion Model for Human Pose Estimation

Arxiv

7+阅读 · 2020年3月30日

Object-aware Aggregation with Bidirectional Temporal Graph for Video Captioning

Arxiv

3+阅读 · 2019年6月11日

Mesh R-CNN

Arxiv

4+阅读 · 2019年6月6日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

Appearance-and-Relation Networks for Video Classification

Arxiv

4+阅读 · 2018年5月6日

Path Aggregation Network for Instance Segmentation

Arxiv

3+阅读 · 2018年3月5日

Depth Masked Discriminative Correlation Filter

Arxiv

7+阅读 · 2018年2月26日

Towards Synthesizing Complex Programs from Input-Output Examples

Arxiv

3+阅读 · 2018年1月30日

Detect-and-Track: Efficient Pose Estimation in Videos

Arxiv

7+阅读 · 2017年12月26日

VIP会员

CVPR2019 | 中科大&微软提出：姿态估计新模型HRNet（已开源）

圆栗子 发自 凹非寺 转载自量子位(QbitAI)

结构不一样

△ 并联

△ 串联

△ 交换单元

横扫各大数据集

开源啦

相关内容

圆栗子发自凹非寺
转载自量子位(QbitAI)