上海交大卢策吾团队CVPR 2018论文（五篇）简介

2018 年 6 月 21 日 上海交大机器视觉与智能实验室

上海交大卢策吾团队（MVIG lab）在CVPR 2018发表五篇论文（第一作者，通信作者均为MVIG成员），简介如下，也请各位同行多提宝贵意见，不胜感谢。

Weakly and Semi Supervised Human Body Part Parsing via Pose-Guided Knowledge Transfer

Spotlight

human parsing是像素级别的人体部位分割，比人体关键点提供更精细信息量，但其标注量巨大，限制了准确率。那么能不能通过迁移学习，用人体关键点（human keypoint）来生产得大量的human parsing数据呢? 我们团队这篇论文做出了深入研究，并在human parsing 数据集上取得目前最好结果。（代码开源在MVIG的Github账号）

DBNet: A Large-Scale Dataset for Driving Behavior Learning

我们一直希望无人驾驶，从视觉信号（视频，点云）到驾驶行为能端到端（end-to-end）地学习。但在这一问题上一直缺乏一个大规模数据库。我们和厦门大学（共同一作，共同通信作者）联合推出了驾驶行为数据集DBnet（Driving Behavior net）包括代码，近期发布（会有相关媒体报道），希望能为该问题提供研究基础，敬请关注。

Environment Upgrade Reinforcement Learning for Non-differentiable Multi-stage Pipelines

Spotlight

增强学习如何修正不良结果，逐步走向正确结果。

Beyond Holistic Object Recognition: Enriching Image Understanding with Part States

为了更深入理解各种语义，我们需要深刻理解到knowledge in part label，而不是简单地知道object category，我们提出一种part-state的概念，即物体part的状态来推断更为深刻的语义信息比如：object functionality，geometry relationship ，affordance， moment situation， interaction。

Recurrent Residual Module for Fast Inference in Videos

视频帧与帧之间存在冗余性，有没有可能利用这种冗余性，达成普遍加速。我们这篇论文给出一个算法，在各种视频应用（video object detection，video pose estimation等等）上普遍降低了计算量。（implementation非常简单）。

AlphaPose

最后，再次推广一下我们的alphapose （72 mAP），在coco超过openpose 相对17% （61 mAP）。我们团队一直持续优化，目前有pytorch版本，速度到5PFS，期望近期能推出25PFS版本。详情请参考我们的项目主页和开源代码。

Prof. Cewu Lu is a research Professor at Shanghai Jiao Tong University, leading Machine Vision and Intelligence Group. He is also one of MIT TR35 -"MIT Technology Review, 35 Innovators Under 35 (China)". He was Postdoc at Stanford AI lab (under Fei-Fei Li and Leonidas Guibas) and selected as the 1000 Overseas Talent Plan (Young Talent) (中组部青年千人计划).

登录查看更多

相关内容

卢策吾

关注 3

卢策吾，上海交通大学研究员，博士生导师，国家海外高层次青年人才，2018年被《麻省理工科技评论》评委35位35岁以下中国科技精英（MIT TR35），2019年获求是杰出青年学者，2020年获上海市科技进步特等奖（排名第三）。在《自然》机器智能子刊、TPAMI、CVPR等高水平期刊和会议发表论近70篇CCF A类论文，11篇扩展版ESI高被引论文），担任《科学》《自然-机器智能》审稿人，CVPR 2020、ICCV 2021、IROS 2021领域主席。研究兴趣包括：行为理解、机器人学习。代表作有人体姿态估计Alphapose（GitHub Star 5000+），HAKE（人体行为引擎），GraspNet（高性能机器人抓取系统）等。

【CVPR 2020 Oral】小样本类增量学习

专知会员服务

112+阅读 · 2020年6月26日

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

3D目标检测进展综述

专知会员服务

193+阅读 · 2020年4月24日

【西安交大】深度学习目标检测方法综述

专知会员服务

164+阅读 · 2020年4月21日