Automatic surgical phase recognition plays an important role in robot-assisted surgeries. Existing methods ignored a pivotal problem that surgical phases should be classified by learning segment-level semantics instead of solely relying on frame-wise information. In this paper, we present a segment-attentive hierarchical consistency network (SAHC) for surgical phase recognition from videos. The key idea is to extract hierarchical high-level semantic-consistent segments and use them to refine the erroneous predictions caused by ambiguous frames. To achieve it, we design a temporal hierarchical network to generate hierarchical high-level segments. Then, we introduce a hierarchical segment-frame attention (SFA) module to capture relations between the low-level frames and high-level segments. By regularizing the predictions of frames and their corresponding segments via a consistency loss, the network can generate semantic-consistent segments and then rectify the misclassified predictions caused by ambiguous low-level frames. We validate SAHC on two public surgical video datasets, i.e., the M2CAI16 challenge dataset and the Cholec80 dataset. Experimental results show that our method outperforms previous state-of-the-arts by a large margin, notably reaches 4.1% improvements on M2CAI16. Code will be released at GitHub upon acceptance.


翻译:自动外科阶段识别在机器人辅助外科手术手术中起着重要作用。 现有方法忽视了外科阶段应当通过学习分层语义而不是仅仅依赖框架信息来分类的关键问题。 在本文中, 我们提出了一个从视频中进行外科阶段识别的分层高度一致性网络( SAHC ) 。 关键的想法是提取高层次的语义一致性部分, 并用它们来改进由模糊框架造成的错误预测。 为了实现这一点, 我们设计了一个时间级级网络, 以生成高等级的高层部分。 然后, 我们引入一个等级分层关注模块( SFA) 来捕捉取低层次框架和高层次部分之间的关系。 通过对框架及其相应部分的预测进行常规化, 通过一致性损失, 网络可以生成语义一致性的分层, 然后纠正由模糊的低层次框架造成的错误分类预测。 我们用两个公共外科视频数据集来验证SAHC, 即 M2CAI16 挑战数据集和 Choloc80 数据集。 实验结果显示, 我们的方法将超越了低级框架和高端的MHIH 接受度, 。

0
下载
关闭预览

相关内容

Networking:IFIP International Conferences on Networking。 Explanation:国际网络会议。 Publisher:IFIP。 SIT: http://dblp.uni-trier.de/db/conf/networking/index.html
【PAISS 2021 教程】概率散度与生成式模型,92页ppt
专知会员服务
34+阅读 · 2021年11月30日
专知会员服务
32+阅读 · 2021年6月12日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
79+阅读 · 2020年7月26日
因果图,Causal Graphs,52页ppt
专知会员服务
248+阅读 · 2020年4月19日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
165+阅读 · 2020年3月18日
已删除
材料科学与工程
6+阅读 · 2019年7月3日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Phase-aware Speech Enhancement with Deep Complex U-Net
VIP会员
相关资讯
已删除
材料科学与工程
6+阅读 · 2019年7月3日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Top
微信扫码咨询专知VIP会员