题目:

SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

简介:

场景文本识别是计算机视觉中的一个热门研究主题。近来,已经提出了许多基于编码-解码器框架的识别方法,它们可以处理透视失真和曲线形状的场景文本。尽管如此,他们仍然面临许多挑战,例如图像模糊,照明不均匀和字符不完整。我们认为,大多数编码器/解码器方法都是基于局部视觉特征而没有明确的全局语义信息。在这项工作中,我们提出了一种语义增强的编码器-解码器框架,以可靠地识别低质量的场景文本。语义信息在编码器模块中用于监视,在解码器模块中用于初始化。特别是,将最新的ASTER方法作为示例集成到所提出的框架中。大量的实验表明,所提出的框架对于低质量的文本图像更健壮,并且在多个基准数据集上都达到了最新的结果。

成为VIP会员查看完整内容
24

相关内容

自然语言处理(NLP)是语言学,计算机科学,信息工程和人工智能的一个子领域,与计算机和人类(自然)语言之间的相互作用有关,尤其是如何对计算机进行编程以处理和分析大量自然语言数据 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
李飞飞等人提出Auto-DeepLab:自动搜索图像语义分割架构
全球人工智能
5+阅读 · 2019年1月14日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
基于GAN的极限图像压缩框架
论智
11+阅读 · 2018年4月15日
Arxiv
4+阅读 · 2019年8月7日
Semantics of Data Mining Services in Cloud Computing
Arxiv
4+阅读 · 2018年10月5日
Arxiv
3+阅读 · 2018年6月14日
Arxiv
11+阅读 · 2018年4月8日
Arxiv
13+阅读 · 2017年12月5日
VIP会员
相关VIP内容
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
微信扫码咨询专知VIP会员