Swin Transformer和拥抱Transformer的五个理由
报告人
胡瀚研究员 微软亚洲研究院
主持人
张兆翔研究员
时间
2021年7月16日(周五) 10:00
参与方式
在bilibili搜索『中科院自动化所』
或扫描下方二维码找到我们
☝记得关注账号接收直播提示哦
本次报告将介绍一种新的视觉骨干网络Swin Transformer,相比于谷歌主要为图像分类问题设计的ViT网络,Swin Transformer对于各种视觉任务都广泛有效,包括图像分类、检测和分割等等。本次报告还将梳理4年来视觉领域逐渐挖掘Transformer优点的发展脉络,并展开讲述拥抱Transformer的5个理由,希望通过这个报告让听众对于Transformer在视觉中的应用有一个整体的了解。
报告人简介
胡瀚,微软亚洲研究院视觉计算组研究员,于2014年和2008年在清华大学自动化系分别获得博士和本科学位,博士论文获得中国人工智能学会优博奖,博士期间曾在宾夕法尼亚大学访学,毕业后曾在百度研究院深度学习实验室工作。担任CVPR 2021/2022领域主席。目前主要研究兴趣是基本视觉建模,视觉自监督学习,以及视觉-语言联合表征学习,是Swin Transformer,关系网络系列和可变形卷积系列的作者。
讲座主办 | 中国科学院自动化所智能感知与计算研究中心
欢迎后台留言、推荐您感兴趣的话题、内容或资讯!
如需转载或投稿,请后台私信。