在近年来,场景文本检测取得了瞩目的进步并被广泛应用到自动驾驶和场景分析等领域。随着文本检测算法的迭代,场景文本检测的关注点已经从原来的水平方向文本和多方向文本转到更具挑战性的任意形状文本上。为了使文本检测算法在任意形状文本上达到更好的效果,亟需一种任意形状文本实例表示方法来提高算法的性能,良好的文本实例表示应当满足求解简单、表示方法参数量低、灵活度高的特点。目前现有的任意形状文本检测器大多在图像的空间域中表示文本实例,基于空间域的表示方法大体上可以分为两种,即像素掩膜表示和轮廓点序列表示。其中,像素掩膜表示方法可能需要繁杂和耗时的后处理过程,同时对训练样本量的需求往往也会更大;而轮廓点序列表示方法对高度弯曲文本的表达能力有限。由于傅里叶系数表示在理论上可以拟合任意的封闭曲线,并且文本轮廓更多集中在低频分量上,所以通过在傅立叶域对不规则场景文字实例进行表征能很好地解决上述问题,并且具有简单、紧凑、对复杂轮廓表达能力好的特点。

本文简要介绍CVPR 2021录用论文“Fourier Contour Embedding for Arbitrary-ShapedText Detection”的主要工作。该论文提出了一种基于傅里叶变换的任意形状文本框的表示方法和预测该文本框表示的算法流程,从而提高了自然场景文本检测中对于高度弯曲文本实例的检测精度。论文代码被商汤科技的OpenMMLab收录,近期将在其MMOCR项目中开源:https://github.com/open-mmlab/mmocr。

成为VIP会员查看完整内容
16

相关内容

[CVPR 2021] 序列到序列对比学习的文本识别
专知会员服务
28+阅读 · 2021年4月14日
CVPR 2021 Oral | 室内动态场景中的相机重定位
专知会员服务
15+阅读 · 2021年4月12日
专知会员服务
29+阅读 · 2021年4月5日
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
56+阅读 · 2020年6月24日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
自然场景下的文字检测:从多方向迈向任意形状
人工智能前沿讲习班
8+阅读 · 2019年6月7日
论文盘点:CVPR 2019 - 文本检测专题
PaperWeekly
14+阅读 · 2019年5月31日
CVPR2019 | 文本检测算法综述
极市平台
34+阅读 · 2019年5月30日
已删除
将门创投
10+阅读 · 2019年3月6日
Arxiv
7+阅读 · 2021年6月21日
Arxiv
3+阅读 · 2018年8月17日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
4+阅读 · 2018年6月5日
Arxiv
19+阅读 · 2018年5月17日
VIP会员
相关VIP内容
[CVPR 2021] 序列到序列对比学习的文本识别
专知会员服务
28+阅读 · 2021年4月14日
CVPR 2021 Oral | 室内动态场景中的相机重定位
专知会员服务
15+阅读 · 2021年4月12日
专知会员服务
29+阅读 · 2021年4月5日
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
56+阅读 · 2020年6月24日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
相关资讯
微信扫码咨询专知VIP会员