极市直播丨ECCV2022-涂正中：让谷歌的骨干网络MaxViT治好你的科研内耗

2022 年 7 月 31 日 极市平台

↑ 点击蓝字关注极市平台

| 极市线上分享第99期 |

一直以来，为让大家更好地了解学界业界优秀的论文和工作，极市已邀请了超过100位技术大咖嘉宾，并完成了98期极市线上直播分享。往期分享请前往bbs.cvmart.net/topics/149或直接阅读原文，也欢迎各位小伙伴自荐或推荐更多优秀的技术嘉宾到极市进行技术分享，与大家一起交流学习~~

近期，Transformer模型在视觉领域大放异彩。Vision Transformer（ViT）出现开启了视觉模型架构设计的新纪元。ViT在大量数据量预训练的情况下可以在ImageNet分类上取得优异的性能。然而，ViT中使用的原始注意力机制具有很高的计算复杂度，从而大大限制了ViT模型作为通用的骨干网络应用到视觉领域的各个下游任务中，特别是需要处理高分辨图片的任务如目标检测、语义分割、或者图像增强。

在这次分享中，我们邀请到了德克萨斯大学奥斯汀分校博士生涂正中，为我们介绍他们提出的宇宙最强骨干网络：

MaxViT：Multi-Axis Vision Transformer （ECCV 2022)

“这是一个混合了卷积和稀疏的多轴注意力的模型架构。具体的，我们提出了一个具有全局和局部感知的、稀疏的多轴注意力模块，仅仅与图像尺寸成线性复杂度，大大优化了原始注意力的平方复杂度。MaxViT作为一个通用的层级型的全局骨干网络在多达五个主流视觉任务上取得了SoTA性能。

Bonus：同时我们也会串讲一篇基于类似想法的底层视觉骨干网络 MAXIM: Multi-Axis MLP for Image Processing (CVPR 22 Oral)，获得最佳论文提名奖。其中，我们提出了一个UNet型的骨干网络，基于一个并行设计的全局/局部的多层感知机算子。MAXIM作为一个通用的底层视觉网络在多达五个底层视觉任务包括去噪、去模糊、去雾、去雨和低光照增强上均取得了SoTA性能。两篇文章证明了我们提出的全局、局部的多轴稀疏方法可以在几乎任何的视觉任务上取得先进的性能，为未来的稀疏注意力设计指明了方向。”

直播信息

时间

2022年8月3日（周三）：20:00-21:00

主题

ECCV 2022 | 让谷歌的骨干网络MaxViT治好你的科研内耗

嘉宾介绍

涂正中

德克萨斯大学奥斯汀分校博士生，师从美国工程院院士Alan Bovik教授。研究方向为视频质量，底层视觉，和骨干架构设计。目前为第一作者在计算机视觉顶级会议或期刊CVPR、ECCV、TIP上发表论文多篇，曾获得CVPR 2022最佳论文提名奖，并多次担任著名计算机视觉会议CVPR、ECCV、TIP等审稿人，曾在YouTube、谷歌研究院等地实习。

关于分享

➤ 分享大纲

1、视觉Transformer与注意力机制的介绍

2、相关工作介绍

3、MaxViT骨干网络

4、MaxVIT性能和效果展示

5、MAXIM骨干网络

6、MAXIM性能和效果展示

7、总结和展望

➤论文

Multi-Axis Vision Transformer（ECCV2022）

论文地址：

https://arxiv.org/abs/2204.01697

代码地址：

https://github.com/google-research/maxvit

MAXIM: Multi-Axis MLP for Image Processing (CVPR 22 Oral)

论文地址：

https://arxiv.org/abs/2201.02973

代码地址：

https://github.com/google-research/maxim

参与方式

关注“极市平台”公众号，回复“99”可获取免费直播链接。

往期回顾

极市平台专注分享计算机视觉前沿资讯和技术干货，特邀请行业内专业牛人嘉宾为大家分享视觉领域内的干货及经验，目前已成功举办98期线上分享。近期在线分享可点击以下标题查看：

更多往期分享请浏览：极市计算机视觉技术分享集锦

（http://bbs.cvmart.net/topics/149/cvshare），也可以点击阅读原文获取。

极市干货

数据集资源汇总： 90+深度学习开源数据集整理｜包括目标检测、工业缺陷、图像分割等多个方向

实操教程：Pytorch - 弹性训练极简实现( 附源码)｜PyTorch常用代码段合集

CVPR 2022： CVPR'22 最新132篇论文分方向整理｜ CVPR'22 最新106篇论文分方向整理｜一文看尽 CVPR 2022 最新 20 篇 Oral 论文

# CV技术社群邀请函 #

△长按添加极市小助手

添加极市小助手微信（ID : cvmart4）

备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳）

即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群

每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

觉得有用麻烦给个在看啦~

登录查看更多

相关内容

ECCV

关注 485

ECCV的全称是European Conference on Computer Vision(欧洲计算机视觉国际会议) ，两年一次，是计算机视觉三大会议（另外两个是ICCV和CVPR）之一。每次会议在全球范围录用论文300篇左右，主要的录用论文都来自美国、欧洲等顶尖实验室及研究所，中国大陆的论文数量一般在10-20篇之间。

CVPR2022论文列表出炉！2067篇论文都在这了！

专知会员服务

55+阅读 · 2022年6月6日

【CVPR 2022】基于windows的图像压缩注意，The Devil Is in the Details: Window-based Attention for Image Compression

专知会员服务

8+阅读 · 2022年3月12日

CVPR2022 | Sparse Transformer刷新点云目标检测的SOTA

专知会员服务

25+阅读 · 2022年3月9日

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

专知会员服务

27+阅读 · 2021年12月3日