| 极市线上分享 第90期 |
一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了89期极市线上直播分享。往期分享请前往bbs.cvmart.net/topics/149或直接阅读原文,也欢迎各位小伙伴自荐或推荐更多优秀的技术嘉宾到极市进行技术分享,与大家一起交流学习~~
在这次分享中,我们邀请到了来自北京大学智能学院的博士生唐业辉,为我们介绍他在本次CVPR 2022中被收录的工作:
An Image Patch is a Wave: Quantum Inspired Vision MLP
视觉 MLP 具有极其简单的架构,它仅由多层感知器(MLP)堆叠而成。与 CNN 和 Transformer 相比,这些简洁的 MLP 架构引入了更少的归纳偏置,具有更强的泛化性能。他们受到量子力学中波粒二象性的启发,将 MLP 中每个图像块 (Token) 表示成波函数的形式,从而提出了一个新型的视觉 MLP 架构——Wave-MLP,在性能上大幅超越了现有 MLP以及 Transformer架构。
01
直播信息
时间
2022年3月24日:20:00-21:00
主题
02
嘉宾介绍
唐业辉
北京大学智能学院四年级博士生,研究方向为视觉主干模型的设计和压缩,在NeurIPS,CVPR、ICCV、T-PAMI等顶级会议和期刊上发表论文17篇。
03
关于分享
1、三种视觉主干模型:CNN、Transformer、MLP
2、视觉MLP的优势和瓶颈
3、WaveMLP的原理、实现、性能
4、相关工作拓展
➤论文地址
An Image Patch is a Wave: Quantum Inspired Vision MLP
论文地址:https://arxiv.org/abs/2111.12294
PyTorch 代码:
https://github.com/huawei-noah/CV-Backbones/tree/master/wavemlp_pytorch
MindSpore 代码:
https://gitee.com/mindspore/models/tree/master/research/cv/wave_mlp
04
参与方式
关注“极市平台”公众号,回复“90”或“唐业辉”可获取免费直播链接。
05
往期回顾
在"极市平台"公众号后台回复期数或者分享嘉宾名字,即可获取极市平台对应期在线分享资料。
06
关于极市平台
觉得有用麻烦给个在看啦~