题目: Text Detection and Recognition in the Wild: A Review
简介: 自然图像中文本的检测和识别是计算机视觉领域中的两个主要问题,在体育视频分析,自动驾驶,工业自动化等方面有广泛的应用。他们面临着常见的挑战性问题,这些问题是如何在多种环境条件下表示和影响文本的因素。当前最新的文本检测和/或识别方法已经利用了深度学习体系结构发展,并报告了基准数据集在以下情况下具有更高的准确性:处理多分辨率和多方位的文本。但是,仍然存在一些影响野生图像中文本的挑战,由于现有模型无法归纳为看不见的数据和标记数据的不足,导致现有方法的执行力不行。因此,与该领域的先前调查不同,该调查的目的如下:首先,提供的不仅是对场景文本检测和识别方面的进展的看法,而且还提出了使用统一评估进行广泛实验的结果,该框架评估在挑战性案例中所选方法的预训练模型,并对这些技术应用相同的评估标准。其次,确定在检测或识别野外图像中存在的几个挑战,即平面旋转,多方向和多分辨率文本,透视变形,照明反射,部分遮挡,复杂字体和特殊字符。最后,论文提供了对该领域潜在研究方向的洞察力,以解决仍面临场景文本检测和识别技术的挑战。