【AAAI2021】用于视频描述的语义分组网络

2021 年 2 月 4 日 专知

 本文提出一种语义分组网络通过建立词组与相关语义视频帧的映射来减少信息冗余。   本文提出了一个语义分组网络(SGN)的视频描述生成网络,该网络尝试(1)使用具有部分已解码描述的可区分词组对视频帧进行分组,然后(2)在预测下一个单词时使用这些语义对齐的视频帧组进行解码。 本文发现连续的帧可能提供了相同的信息,然而现有方法集中于仅基于输入视频来丢弃或合并重复信息。语义分组网络学习了一种算法来捕获部分已解码描述中最具区分性的词组以及将每个词组与相关视频帧的映射,通过建立此映射可以将语义上相关的帧聚类,从而减少冗余。与现有方法相反,来自已解码描述词的连续反馈使语义分组网络能够动态更新适应部分解码描述的视频表示。此外,本文提出了一种对比注意损失,以促进单词短语和视频帧之间的准确对齐而无需人工注释。

https://www.zhuanzhi.ai/paper/ca2f9fa733ff339f5ca3e10526823d47



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“SGVC” 可以获取《【AAAI2021】用于视频描述的语义分组网络》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
2

相关内容

【AAAI2021】生成式Transformer的对比三元组提取
专知会员服务
49+阅读 · 2021年2月7日
【AAAI2021】双级协作变换器Transformer图像描述生成
专知会员服务
26+阅读 · 2021年1月26日
【AAAI2021】知识图谱增强的预训练模型的生成式常识推理
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
36+阅读 · 2021年1月24日
【AAAI2021】用于多标签图像分类的深度语义词典学习
专知会员服务
14+阅读 · 2020年12月30日
【AAAI2021】记忆门控循环网络
专知会员服务
48+阅读 · 2020年12月28日
专知会员服务
46+阅读 · 2020年12月20日
【AAAI2021】 层次图胶囊网络
专知会员服务
82+阅读 · 2020年12月18日
【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习
【AAAI2021】自监督对应学习的对比转换
专知
12+阅读 · 2020年12月11日
【NeurIPS 2020】核基渐进蒸馏加法器神经网络
专知
13+阅读 · 2020年10月19日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
最新《动态网络嵌入》综述论文,25页pdf
专知
34+阅读 · 2020年6月17日
注意力图神经网络的多标签文本分类
专知
8+阅读 · 2020年3月28日
Weight Poisoning Attacks on Pre-trained Models
Arxiv
5+阅读 · 2020年4月14日
Advances in Online Audio-Visual Meeting Transcription
Arxiv
4+阅读 · 2019年12月10日
Arxiv
5+阅读 · 2019年4月21日
Arxiv
6+阅读 · 2019年4月4日
Adversarial Metric Attack for Person Re-identification
VIP会员
相关VIP内容
【AAAI2021】生成式Transformer的对比三元组提取
专知会员服务
49+阅读 · 2021年2月7日
【AAAI2021】双级协作变换器Transformer图像描述生成
专知会员服务
26+阅读 · 2021年1月26日
【AAAI2021】知识图谱增强的预训练模型的生成式常识推理
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
36+阅读 · 2021年1月24日
【AAAI2021】用于多标签图像分类的深度语义词典学习
专知会员服务
14+阅读 · 2020年12月30日
【AAAI2021】记忆门控循环网络
专知会员服务
48+阅读 · 2020年12月28日
专知会员服务
46+阅读 · 2020年12月20日
【AAAI2021】 层次图胶囊网络
专知会员服务
82+阅读 · 2020年12月18日
【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习
Top
微信扫码咨询专知VIP会员