We address the problem of temporal sentence localization in videos (TSLV). Traditional methods follow a top-down framework which localizes the target segment with pre-defined segment proposals. Although they have achieved decent performance, the proposals are handcrafted and redundant. Recently, bottom-up framework attracts increasing attention due to its superior efficiency. It directly predicts the probabilities for each frame as a boundary. However, the performance of bottom-up model is inferior to the top-down counterpart as it fails to exploit the segment-level interaction. In this paper, we propose an Adaptive Proposal Generation Network (APGN) to maintain the segment-level interaction while speeding up the efficiency. Specifically, we first perform a foreground-background classification upon the video and regress on the foreground frames to adaptively generate proposals. In this way, the handcrafted proposal design is discarded and the redundant proposals are decreased. Then, a proposal consolidation module is further developed to enhance the semantic of the generated proposals. Finally, we locate the target moments with these generated proposals following the top-down framework. Extensive experiments on three challenging benchmarks show that our proposed APGN significantly outperforms previous state-of-the-art methods.


翻译:传统方法遵循一个自上而下的框架,将目标部分与预先界定的部分建议本地化。虽然这些提议已经实现了体面的业绩,但都是手工制作的和多余的。最近,自下而上的框架因其高效率而吸引了越来越多的注意力。它直接预测了每个框架作为一个边界的概率。然而,自下而上模式的性能低于自上而下对口的性能,因为它未能利用分层互动。在本文件中,我们提议了一个调控提案生成网络(APGN),以维持部分层面的互动,同时加快效率。具体地说,我们首先对视频进行地表层的地面分类,并在前方框架进行反向后方的分类,以适应性地生成建议。这样,手动提案的设计就被放弃,多余的建议被减少。然后,进一步开发一个建议整合模块,以加强所产生提案的语义性。最后,我们在自上而下而上而下的框架之后,我们将这些目标时间点定位为目标时刻。在三个具有挑战性的基准上进行广泛的实验,显示我们提出的APGN的拟议方法大大超越了以前的状态。

0
下载
关闭预览

相关内容

【EMNLP2020】自然语言生成,Neural Language Generation
专知会员服务
39+阅读 · 2020年11月20日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
内涵网络嵌入:Content-rich Network Embedding
我爱读PAMI
4+阅读 · 2019年11月5日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
5+阅读 · 2018年3月30日
Arxiv
3+阅读 · 2018年3月5日
VIP会员
相关VIP内容
【EMNLP2020】自然语言生成,Neural Language Generation
专知会员服务
39+阅读 · 2020年11月20日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
Top
微信扫码咨询专知VIP会员