上海交大卢策吾团队CVPR 2018论文(五篇)简介

2018 年 6 月 21 日 上海交大机器视觉与智能实验室

    上海交大卢策吾团队(MVIG lab)在CVPR 2018发表五篇论文(第一作者,通信作者均为MVIG成员),简介如下,也请各位同行多提宝贵意见,不胜感谢。


01

Weakly and Semi Supervised Human Body Part Parsing via Pose-Guided Knowledge Transfer

Spotlight


    human parsing是像素级别的人体部位分割,比人体关键点提供更精细信息量,但其标注量巨大,限制了准确率。那么能不能通过迁移学习,用人体关键点(human keypoint)来生产得大量的human parsing数据呢? 我们团队这篇论文做出了深入研究,并在human parsing 数据集上取得目前最好结果。(代码开源在MVIG的Github账号)


点击边框调出视频工具条
   


02

DBNet: A Large-Scale Dataset for Driving Behavior Learning


    我们一直希望无人驾驶,从视觉信号(视频,点云)到驾驶行为能端到端(end-to-end)地学习。但在这一问题上一直缺乏一个大规模数据库。我们和厦门大学(共同一作,共同通信作者)联合推出了驾驶行为数据集DBnet(Driving Behavior net)包括代码,近期发布(会有相关媒体报道),希望能为该问题提供研究基础,敬请关注。


点击边框调出视频工具条
   


03

Environment Upgrade Reinforcement Learning for Non-differentiable Multi-stage Pipelines 

Spotlight


    增强学习如何修正不良结果,逐步走向正确结果。


点击边框调出视频工具条
   


04

Beyond Holistic Object Recognition: Enriching Image Understanding with Part States


    为了更深入理解各种语义,我们需要深刻理解到knowledge in part label,而不是简单地知道object category,我们提出一种part-state的概念,即物体part的状态来推断更为深刻的语义信息比如:object functionality,geometry relationship ,affordance, moment situation, interaction。



05

Recurrent Residual Module for Fast Inference in Videos


     视频帧与帧之间存在冗余性,有没有可能利用这种冗余性,达成普遍加速。我们这篇论文给出一个算法,在各种视频应用(video object detection,video pose estimation等等)上普遍降低了计算量。(implementation非常简单)。




  AlphaPose  

最后,再次推广一下我们的alphapose72 mAP),在coco超过openpose 相对17% (61 mAP。我们团队一直持续优化,目前有pytorch版本,速度到5PFS,期望近期能推出25PFS版本。详情请参考我们的项目主页和开源代码。





Prof. Cewu Lu is a research Professor at Shanghai Jiao Tong University, leading Machine Vision and Intelligence Group. He is also one of MIT TR35 -"MIT Technology Review, 35 Innovators Under 35 (China)". He was Postdoc at Stanford AI lab (under Fei-Fei Li and Leonidas Guibas) and selected as the 1000 Overseas Talent Plan (Young Talent) (中组部青年千人计划).  


登录查看更多
0

相关内容

卢策吾,上海交通大学研究员,博士生导师,国家海外高层次青年人才,2018年被《麻省理工科技评论》评委35位35岁以下中国科技精英(MIT TR35),2019年获求是杰出青年学者,2020年获上海市科技进步特等奖(排名第三)。在《自然》机器智能子刊、TPAMI、CVPR等高水平期刊和会议发表论近70篇CCF A类论文,11篇扩展版ESI高被引论文),担任《科学》《自然-机器智能》审稿人,CVPR 2020、ICCV 2021、IROS 2021领域主席。研究兴趣包括:行为理解、机器人学习。代表作有人体姿态估计Alphapose(GitHub Star 5000+),HAKE(人体行为引擎),GraspNet(高性能机器人抓取系统)等。
专知会员服务
111+阅读 · 2020年6月26日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
专知会员服务
160+阅读 · 2020年4月21日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【CVPR2020-百度】用于视觉识别的门控信道变换
专知会员服务
12+阅读 · 2020年3月30日
专知会员服务
109+阅读 · 2020年3月12日
CVPR 2019 | 34篇 CVPR 2019 论文实现代码
AI科技评论
21+阅读 · 2019年6月23日
CVPR 2018 笔记
计算机视觉战队
3+阅读 · 2018年5月25日
Mask R-CNN 论文笔记
统计学习与视觉计算组
11+阅读 · 2018年3月22日
Arxiv
5+阅读 · 2019年10月11日
Arxiv
11+阅读 · 2018年4月8日
Arxiv
6+阅读 · 2018年4月4日
Arxiv
3+阅读 · 2018年3月21日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
10+阅读 · 2017年11月22日
VIP会员
相关VIP内容
专知会员服务
111+阅读 · 2020年6月26日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
专知会员服务
160+阅读 · 2020年4月21日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【CVPR2020-百度】用于视觉识别的门控信道变换
专知会员服务
12+阅读 · 2020年3月30日
专知会员服务
109+阅读 · 2020年3月12日
Top
微信扫码咨询专知VIP会员