【CVPR2020-斯坦福】知识蒸馏时空图的视频描述,Spatio-Temporal Graph

2020 年 4 月 2 日 专知




视频描述是一项具有挑战性的任务,需要对视觉场景有深刻的理解。最先进的方法使用场景级或对象级信息生成标题,但不显式地建模对象交互。因此,他们往往无法做出有视觉根据的预测,而且对虚假的相关性很敏感。本文提出了一种新的视频描述时空图模型,该模型利用了时空中物体间的相互作用。我们的模型建立了可解释的链接,并能够提供明确的视觉基础。为了避免由于对象数量的变化而导致系统性能的不稳定,提出了一种基于局部对象信息的全局场景特征正则化的对象感知知识提取机制。我们通过在两个基准上的大量实验来证明我们的方法的有效性,表明我们的方法具有可解释预测的竞争性能。


https://www.zhuanzhi.ai/paper/4729866d34c784d60bdad8d04f3dc6b2

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“STG” 就可以获取【CVPR2020-斯坦福】知识蒸馏时空图的视频描述,Spatio-Temporal Graph》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

【ICML2020】持续图神经网络,Continuous Graph Neural Networks
专知会员服务
146+阅读 · 2020年6月28日
【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
25+阅读 · 2020年5月25日
图卷积神经网络蒸馏知识,Distillating Knowledge from GCN
专知会员服务
94+阅读 · 2020年3月25日
五篇 ICCV 2019 的【图神经网络(GNN)+CV】相关论文
专知会员服务
14+阅读 · 2020年1月9日
【CVPR2019教程】视频理解中的图表示学习
专知
43+阅读 · 2019年6月20日
新任务&数据集:视觉常识推理(VCR)
专知
50+阅读 · 2018年12月1日
Arxiv
5+阅读 · 2019年6月5日
VIP会员
Top
微信扫码咨询专知VIP会员