Modern semantic segmentation methods devote much attention to adjusting feature representations to improve the segmentation performance in various ways, such as metric learning, architecture design, etc. However, almost all those methods neglect the particularity of boundary pixels. These pixels are prone to obtain confusing features from both sides due to the continuous expansion of receptive fields in CNN networks. In this way, they will mislead the model optimization direction and make the class weights of such categories that tend to share many adjacent pixels lack discrimination, which will damage the overall performance. In this work, we dive deep into this problem and propose a novel method named Embedded Superpixel CRF (ES-CRF) to address it. ES-CRF involves two main aspects. On the one hand, ES-CRF innovatively fuses the CRF mechanism into the CNN network as an organic whole for more effective end-to-end optimization. It utilizes CRF to guide the message passing between pixels in high-level features to purify the feature representation of boundary pixels, with the help of inner pixels belong to the same object. On the other hand, superpixel is integrated into ES-CRF to exploit the local object prior for more reliable message passing. Finally, our proposed method yields new records on two challenging benchmarks, i.e., Cityscapes and ADE20K. Moreover, we make detailed theoretical analysis to verify the superiority of ES-CRF.


翻译:现代语义分解方法非常关注调整地貌表示方式,以多种方式(如计量学习、建筑设计等)改善分化性能。然而,几乎所有这些方法都忽略了边界像素的特殊性。这些像素由于CNN网络中接收场的不断扩大,很容易从双方获得混淆性特征。这样,它们会误导模型优化方向,使这类类别中倾向于共享许多相邻像素的等级权重,从而损害总体性能。在这项工作中,我们深入探讨这一问题,并提出一种名为嵌入式超级像素通用报告格式(ES-CRF)的新方法来解决这个问题。ES-C格式涉及两个主要方面。一方面,ES-CRF创新地将通用报告格式机制作为有机整体纳入CNN网络,以便更有效地实现端对端优化。它利用通用报告格式来指导高层次特征中像素之间的传递信息,以净化边界像素的特征代表,而内部象素的帮助属于同一对象。在另一方面,ESC的内嵌像素是内部像素的帮助。ES-C-C-C-C-Suprecialalalalal realal reduction reductionalal redufal reducal reviducal reducal reduflation 。最后,我们使用了ES-chal reviewviewview 和ES-chal reviducoldududucal remax

1
下载
关闭预览

相关内容

条件随机域(场)(conditional random fields,简称 CRF,或CRFs),是一种判别式概率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列。 如同马尔可夫随机场,条件随机场为具有无向的图模型,图中的顶点代表随机变量,顶点间的连线代表随机变量间的相依关系,在条件随机场中,随机变量 Y 的分布为条件机率,给定的观察值则为随机变量 X。原则上,条件随机场的图模型布局是可以任意给定的,一般常用的布局是链结式的架构,链结式架构不论在训练(training)、推论(inference)、或是解码(decoding)上,都存在效率较高的算法可供演算。
NeurIPS 2021丨K-Net: 迈向统一的图像分割
专知会员服务
16+阅读 · 2021年11月25日
【SIGIR2021】自然语言处理图深度学习,230页ppt
专知会员服务
93+阅读 · 2021年7月23日
弱监督语义分割最新方法资源列表
专知
9+阅读 · 2019年2月26日
已删除
将门创投
3+阅读 · 2018年3月13日
Learning Dynamic Routing for Semantic Segmentation
Arxiv
8+阅读 · 2020年3月23日
Arxiv
8+阅读 · 2018年5月15日
VIP会员
相关VIP内容
NeurIPS 2021丨K-Net: 迈向统一的图像分割
专知会员服务
16+阅读 · 2021年11月25日
【SIGIR2021】自然语言处理图深度学习,230页ppt
专知会员服务
93+阅读 · 2021年7月23日
相关资讯
弱监督语义分割最新方法资源列表
专知
9+阅读 · 2019年2月26日
已删除
将门创投
3+阅读 · 2018年3月13日
Top
微信扫码咨询专知VIP会员