对自然图像中的文本进行检测和识别是计算机视觉领域的两个主要问题,在体育视频分析、自动驾驶、工业自动化等领域都有广泛的应用。他们面临着共同的具有挑战性的问题,即文本如何表示和受几种环境条件的影响的因素。当前最先进的场景文本检测和/或识别方法利用了深度学习体系结构的进步,并取得了在处理多分辨率和多方向文本时基准数据集的卓越准确性。然而,仍然有几个挑战影响自然图像中的文本,导致现有的方法表现不佳,因为这些模型不能泛化到看不见的数据和不足的标记数据。因此,不同于以往的综述,这个综述的目标如下: 首先,提供读者不仅回顾最近场景文字检测和识别方法,但也用一个统一的评估框架来呈现广泛开展实验的结果, 评估pre-trained模型选择的方法上具有挑战性的情况下,这些技术适用于相同的评估标准。其次,识别在自然图像中检测或识别文本存在的几个挑战,即平面内旋转、多方向和多分辨率文本、透视失真、光照反射、部分遮挡、复杂字体和特殊字符。最后,本文还提出了这一领域的潜在研究方向,以解决场景文本检测和识别技术仍面临的一些挑战。

成为VIP会员查看完整内容
56
0

相关内容

最新《深度半监督学习》综述论文,43页pdf
专知会员服务
123+阅读 · 2020年6月12日
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
69+阅读 · 2020年5月5日
卷积神经网络的概述论文:分析、应用和展望,21页pdf
专知会员服务
75+阅读 · 2020年4月7日
零样本图像识别综述论文
专知会员服务
53+阅读 · 2020年4月4日
安全和健壮的医疗机器学习综述,附22页pdf
专知会员服务
42+阅读 · 2020年1月25日
[综述]深度学习下的场景文本检测与识别
专知会员服务
56+阅读 · 2019年10月10日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
100+阅读 · 2019年6月16日
自然场景文本检测技术综述(CTPN, SegLink, EAST)
极市平台
10+阅读 · 2019年7月30日
论文盘点:CVPR 2019 - 文本检测专题
PaperWeekly
13+阅读 · 2019年5月31日
CVPR2019 | 文本检测算法综述
极市平台
33+阅读 · 2019年5月30日
白翔:复杂开放场景中的文本理解
深度学习大讲堂
11+阅读 · 2018年6月5日
微信OCR(1)——公众号图文识别中的文本检测
微信AI
17+阅读 · 2017年11月22日
Anomalous Instance Detection in Deep Learning: A Survey
Image Segmentation Using Deep Learning: A Survey
Arxiv
37+阅读 · 2020年1月15日
Arxiv
4+阅读 · 2019年12月2日
Polarity Loss for Zero-shot Object Detection
Arxiv
3+阅读 · 2018年11月22日
Arxiv
4+阅读 · 2018年1月19日
小贴士
相关VIP内容
最新《深度半监督学习》综述论文,43页pdf
专知会员服务
123+阅读 · 2020年6月12日
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
69+阅读 · 2020年5月5日
卷积神经网络的概述论文:分析、应用和展望,21页pdf
专知会员服务
75+阅读 · 2020年4月7日
零样本图像识别综述论文
专知会员服务
53+阅读 · 2020年4月4日
安全和健壮的医疗机器学习综述,附22页pdf
专知会员服务
42+阅读 · 2020年1月25日
[综述]深度学习下的场景文本检测与识别
专知会员服务
56+阅读 · 2019年10月10日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
100+阅读 · 2019年6月16日
相关资讯
微信扫码咨询专知VIP会员