VALSE 论文速览 第20期:GAIA:一个目标检测下游迁移框架

2021 年 10 月 26 日 VALSE

为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周二和周五各发布一篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自中科院自动化所的工作。该工作由张兆翔教授指导,彭君然卜兴源同学完成,将为大家呈现视觉目标检测领域前沿的定制化迁移系统


论文题目:GAIA:一个目标检测下游迁移框架

作者列表:卜兴源 (中科院自动化所),彭君然 (中科院自动化所),闫俊杰 (中科院自动化所),谭铁牛 (中科院自动化所),张兆翔 (中科院自动化所)

B站观看网址:

https://www.bilibili.com/video/BV1Eq4y1R71i/


复制链接到浏览器打开或点击阅读原文即可跳转至观看页面。


论文摘要:

近期,在计算机和自然语言处理等领域,使用大规模数据和大模型预训练随后在下游微调的策略已经成为迁移学习最有效最可靠的新范式。尽管这种模式展现出了极其优秀的效果,然而这种策略带来了相当的笨重性,即给下游的定制化带来了难度和成本问题。举例而言,当用户需要在不同的设备上运行指定大小的模型,大模型无法满足需求,而定制化模型在大数据上重训练将引入巨大的成本。基于这一点,我们设计了一套大数据大模型迁移学习的新范式,作为大模型大数据预训练和下游定制化的桥梁,既完成了大数据赋能的模型定制化,又极大地节约了成本。与过去大数据上训练单一的大模型不同,我们选择在大数据下训练一个超网 (也可理解为模型族),然后根据用户的要求和下游domain特点进行模型定制化的结构和权重抽取。与以往在COCO数据集上评测不同,我们收集了KITTI, VOC, WiderFace, DOTA, Clipart, Comic等十个下游数据进行评测,涵盖医疗,航拍,漫画等各种场景,真正证明了我们方案的可靠性和泛化性。我们的方案在以上十个下游数据集上进行高效全自动的模型抽取和适配,做到比baseline的mAP提升多达9.8。模型和代码已开源,欢迎大家使用:https://github.com/GAIA-vision/GAIA-det.


论文信息:

[1] Bu, X.*, Peng, J. *, Yan, J., Tan, T. and Zhang, Z., 2021. GAIA: A Transfer Learning System of Object Detection That Fits Your Needs. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2021).


视频讲者简介:

彭君然,本科毕业于清华大学,博士毕业于中科院自动化所,目前就职于华为云。目前的研究兴趣为目标检测,AutoML,大规模机器学习系统,在ICCV,NeurIPS,CVPR等顶级会议发表5篇文章。



特别鸣谢本次论文速览主要组织者:

月度轮值AC:刘洋 (北京大学),林迪 (天津大学),朱霖潮 (悉尼科技大学)

季度责任AC:王兴刚 (华中科技大学)


活动参与方式

1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们!

直播地址:

https://live.bilibili.com/22300737;

历史视频观看地址:

https://space.bilibili.com/562085182/ 


2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ R群,群号:137634472);


*注:申请加入VALSE QQ群时需验证姓名、单位和身份缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。


3. VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。


4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。


看到这了,确定不关注下吗?关注下再走吧~



登录查看更多
0

相关内容

VALSE 发起于 2011年,是 Vision And Learning Seminar 的简写,取“华尔兹舞”之意。目的是为全球计算机视觉、模式识别、机器学习、多媒体技术等相关领域的华人青年学者提供一个平等、自由的学术交流舞台。官网:http://valser.org/
【CVPR2022】GaTector:凝视对象预测的统一框架
专知会员服务
9+阅读 · 2022年3月24日
中科院自动化所19篇AAAI 2022论文速览!从CV\NLP到机器学习
专知会员服务
45+阅读 · 2021年12月21日
专知会员服务
22+阅读 · 2021年9月20日
专知会员服务
26+阅读 · 2021年8月24日
专知会员服务
37+阅读 · 2021年3月31日
专知会员服务
26+阅读 · 2021年3月5日
Transformer替代CNN?8篇论文概述最新进展!
专知会员服务
76+阅读 · 2021年1月19日
国家自然科学基金
22+阅读 · 2016年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
8+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Residual Mixture of Experts
Arxiv
0+阅读 · 2022年4月20日
Challenges for Open-domain Targeted Sentiment Analysis
Arxiv
27+阅读 · 2021年11月11日
Arxiv
14+阅读 · 2020年10月26日
VIP会员
相关VIP内容
【CVPR2022】GaTector:凝视对象预测的统一框架
专知会员服务
9+阅读 · 2022年3月24日
中科院自动化所19篇AAAI 2022论文速览!从CV\NLP到机器学习
专知会员服务
45+阅读 · 2021年12月21日
专知会员服务
22+阅读 · 2021年9月20日
专知会员服务
26+阅读 · 2021年8月24日
专知会员服务
37+阅读 · 2021年3月31日
专知会员服务
26+阅读 · 2021年3月5日
Transformer替代CNN?8篇论文概述最新进展!
专知会员服务
76+阅读 · 2021年1月19日
相关基金
国家自然科学基金
22+阅读 · 2016年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
8+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员