题目: Capsule Networks for Computer Vision
报告简介: 胶囊网络提供了一种有效的方法来建模实体之间的部分对整个关系,并允许学习视点不变表示。 通过这种改进的表示学习,胶囊网络能够在多个域中实现良好的性能,而参数数量却大大减少。 最近,胶囊网络已显示出人类动作在视频中的定位,医学图像中的对象分割以及文本分类的最新结果。 本教程将提供对胶囊网络的基本了解,并且我们将讨论其在各种计算机视觉任务中的使用,例如图像分类,对象分割和活动检测。
嘉宾介绍:
Mubarak Shah,计算机科学讲座教授,UCF计算机视觉研究中心的创始主任。他的研究兴趣包括:视频监视,视觉跟踪,人类活动识别,拥挤场景的视觉分析,视频注册,无人机视频分析等。Shah博士是IEEE,AAAS,IAPR和SPIE的研究员。 2006年,他被授予飞马教授奖,这是UCF的最高奖项。他是ACM杰出的演讲者。他曾在1997-2000年担任IEEE杰出访客发言人,并于1997年获得IEEE杰出工程教育家奖。他于1999年获得了哈里斯公司的工程成就奖,并于1995、1997和2000年获得了联合国开发计划署的TOKTEN奖; 1995年和2003年授予教学激励计划奖,2003年和2009年授予研究激励奖,2005年和2006年授予百万富翁俱乐部奖,2007年授予大学杰出研究员奖,并为2005年ICCV荣誉奖。挑战问题,并在2005年ACM多媒体会议上获得最佳论文奖提名。他是视频计算国际丛书的编辑。 《机器视觉与应用》杂志主编,《 ACM计算调查》杂志副主编。他是IEEE Transactions on PAMI的副编辑,也是《国际计算机视觉视频计算杂志》特刊的特约编辑。
Rawat博士是UCF计算机视觉研究中心的助理教授。他的研究兴趣在于计算机视觉,机器学习,社交计算和多媒体的交叉领域。他于2012年至2017年在新加坡国立大学计算机学院获得计算机科学博士学位,并在该大学的多媒体分析与综合实验室与Mohan Kankanhalli教授一起工作。他的博士论文致力于利用社交媒体和相机传感器增强用户的摄影体验。它的重点是计算媒体美学和对用于摄影的社交媒体图像的分析。他于2017-2019年在UCF计算机视觉研究中心与Mubarak Shah教授进行了博士后培训。他于2009年在瓦拉纳西IIT-BHU印度理工学院获得了计算机科学与工程学士学位。在2012年夏季加入NUS之前,他曾于2009年至2012年在印度Mentor Graphics的Praveen Shukla工作。在Veloce Emulation团队工作。他是乒乓球爱好者,并且在这项运动中赢得了许多奖牌。