Effective explanations of video action recognition models should disentangle how movements unfold over time from the surrounding spatial context. However, existing methods based on saliency produce entangled explanations, making it unclear whether predictions rely on motion or spatial context. Language-based approaches offer structure but often fail to explain motions due to their tacit nature -- intuitively understood but difficult to verbalize. To address these challenges, we propose Disentangled Action aNd Context concept-based Explainable (DANCE) video action recognition, a framework that predicts actions through disentangled concept types: motion dynamics, objects, and scenes. We define motion dynamics concepts as human pose sequences. We employ a large language model to automatically extract object and scene concepts. Built on an ante-hoc concept bottleneck design, DANCE enforces prediction through these concepts. Experiments on four datasets -- KTH, Penn Action, HAA500, and UCF-101 -- demonstrate that DANCE significantly improves explanation clarity with competitive performance. We validate the superior interpretability of DANCE through a user study. Experimental results also show that DANCE is beneficial for model debugging, editing, and failure analysis.


翻译:有效的视频动作识别模型解释应当将随时间展开的运动动态与周围空间上下文解耦。然而,现有基于显著性的方法产生纠缠的解释,导致无法明确预测是依赖于运动还是空间上下文。基于语言的方法虽提供结构化解释,但由于运动的默会性——可直观理解但难以言表——常无法有效解释运动动态。为应对这些挑战,我们提出基于解耦动作与上下文概念的可解释(DANCE)视频动作识别框架,该框架通过解耦的概念类型(运动动态、物体和场景)预测动作。我们将运动动态概念定义为人体姿态序列,并利用大语言模型自动提取物体与场景概念。基于先验概念瓶颈设计,DANCE强制通过这些概念进行预测。在KTH、Penn Action、HAA500和UCF-101四个数据集上的实验表明,DANCE在保持竞争力的性能同时显著提升了解释清晰度。通过用户研究验证了DANCE更优的可解释性。实验结果同时表明,DANCE有助于模型调试、编辑与故障分析。

0
下载
关闭预览

相关内容

【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员