许多自然场景图像中都包含着丰富的文本,他们对于场景理解有着重要的作用。随着移动互联网技术的飞速发展,许多新的应用场景都需要利用这些文本信息,例如招牌识别和自动驾驶等。因此,自然场景文本的分析与处理也越来越成为计算机视觉领域的研究热点之一,该任务主要包括文本检测与识别。传统的文本检测和识别方法依赖于人工设计的特征和规则,且模型设计复杂、效率低、泛化性能差。近年来随着深度学习的发展,自然场景文本检测、自然场景文本识别以及端到端的自然场景文本检测与识别都取得了突破性的进展,其性能和效率都得到了显著提高。本文介绍了该领域相关的研究背景,对近几年基于深度学习的自然场景文本检测、识别以及端到端自然场景文本检测与识别的方法进行整理分类、归纳和总结,阐述了各类方法的基本思想和优缺点。并针对隶属于不同类别下的方法,进一步论述和分析这些主要模型的算法流程、适用场景和他们的技术发展路线。此外还列举说明了一些主流公开数据集,并对比了各个模型方法在代表性数据集上的性能情况。最后本文总结了目前不同场景数据下的自然场景文本检测、识别以及端到端自然场景文本检测与识别算法的局限性以及未来的挑战和发展趋势。

http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=202101210000003&journal_id=jig

成为VIP会员查看完整内容
45

相关内容

专知会员服务
121+阅读 · 2021年4月29日
基于深度学习的行人检测方法综述
专知会员服务
68+阅读 · 2021年4月14日
专知会员服务
69+阅读 · 2021年3月23日
专知会员服务
21+阅读 · 2021年1月5日
深度学习目标检测方法综述
专知会员服务
273+阅读 · 2020年8月1日
【文献综述】深度学习目标检测方法及其主流框架综述
专知会员服务
118+阅读 · 2020年6月26日
基于深度学习的表面缺陷检测方法综述
专知会员服务
93+阅读 · 2020年5月31日
基于深度学习的手语识别综述
专知会员服务
46+阅读 · 2020年5月18日
专知会员服务
160+阅读 · 2020年4月21日
【中科院】命名实体识别技术综述
专知
16+阅读 · 2020年4月21日
基于深度学习的视频目标检测综述
极市平台
15+阅读 · 2019年7月19日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
38+阅读 · 2019年4月18日
干货 | 基于深度学习的目标检测算法综述(二)
AI科技评论
21+阅读 · 2018年8月20日
AI综述专栏 | 步态识别的深度学习综述
人工智能前沿讲习班
29+阅读 · 2018年6月27日
Arxiv
0+阅读 · 2021年5月10日
Arxiv
0+阅读 · 2021年5月10日
One-Class Classification: A Survey
Arxiv
7+阅读 · 2021年1月8日
Monocular Plan View Networks for Autonomous Driving
Arxiv
6+阅读 · 2019年5月16日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
VIP会员
相关VIP内容
专知会员服务
121+阅读 · 2021年4月29日
基于深度学习的行人检测方法综述
专知会员服务
68+阅读 · 2021年4月14日
专知会员服务
69+阅读 · 2021年3月23日
专知会员服务
21+阅读 · 2021年1月5日
深度学习目标检测方法综述
专知会员服务
273+阅读 · 2020年8月1日
【文献综述】深度学习目标检测方法及其主流框架综述
专知会员服务
118+阅读 · 2020年6月26日
基于深度学习的表面缺陷检测方法综述
专知会员服务
93+阅读 · 2020年5月31日
基于深度学习的手语识别综述
专知会员服务
46+阅读 · 2020年5月18日
专知会员服务
160+阅读 · 2020年4月21日
相关论文
Arxiv
0+阅读 · 2021年5月10日
Arxiv
0+阅读 · 2021年5月10日
One-Class Classification: A Survey
Arxiv
7+阅读 · 2021年1月8日
Monocular Plan View Networks for Autonomous Driving
Arxiv
6+阅读 · 2019年5月16日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
微信扫码咨询专知VIP会员