简介: 动作识别通常将动作和活动视为视频中发生的整体事件。但是,认知科学和神经科学的证据表明,人们积极地将活动编码为一致的层次结构。但是,在计算机视觉中,很少有关于编码事件单语的表示的探索。论文引入了动作基因组,该基因组将动作分解为时空场景图。动作发生时,基因组捕获对象之间的变化及其成对关系。它包含10K视频,其中有40万个对象和170万个可视关系。使用动作基因组,我们通过合并场景图的时空特征库来扩展现有的动作识别模型,以在Charades数据集上实现更好的性能。接下来,通过分解和学习导致动作的视觉关系的时间变化,我们通过启用少拍动作识别来演示分层事件分解的效用,仅使用10个示例就可以实现42.7%的mAP。最后,我们以时空场景图预测的新任务为基准对现有场景图模型进行基准测试。

成为VIP会员查看完整内容
39

相关内容

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
92+阅读 · 2020年6月19日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
论文浅尝 | 时序与因果关系联合推理
开放知识图谱
33+阅读 · 2019年6月23日
论文浅尝 | 使用循环神经网络的联合事件抽取
开放知识图谱
25+阅读 · 2019年4月28日
【CVPR2018】物体检测中的结构推理网络
深度学习大讲堂
5+阅读 · 2018年7月30日
【学界】 李飞飞学生最新论文:利用场景图生成图像
GAN生成式对抗网络
15+阅读 · 2018年4月9日
Learning by Abstraction: The Neural State Machine
Arxiv
6+阅读 · 2019年7月11日
Attend More Times for Image Captioning
Arxiv
6+阅读 · 2018年12月8日
Arxiv
5+阅读 · 2018年3月30日
VIP会员
相关VIP内容
【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
92+阅读 · 2020年6月19日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
微信扫码咨询专知VIP会员