项目名称: 基于图模型的场景文字与叠加文字提取识别技术研究

项目编号: No.61271434

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 无线电电子学、电信技术

项目作者: 王伟强

作者单位: 中国科学院大学

项目金额: 76万元

中文摘要: 准确提取识别图片视频中的图形像素文字具有重要的研究意义与广阔应用前景。本项目将系统地研究涉及的各种关键技术,包括场景文字的定位、分割、矫正、复杂背景中叠加文字的定位、分割,以及非理想分割状况下的字符识别,并注重一般性理论的拓广创新。具体的研究问题包括:基于图模型的一般场景文字检测算法;先验知识导向下低分辨率、复杂光照条件下场景文字的检测方法;将边缘检测与区域分割融为一体的高效分割技术;对于发生透视变形的场景文字,基于多种线索的视图矫正计算方法;可同时提取叠加文字与场景文字的统一方法;基于冗余多叉树与图模型求解带噪声的大数目类别的识别模型。本项目的研究内容不仅与实际应用紧密相关,同时项目潜在的研究成果对丰富目标检测、对象分割、机器学习等基础理论也具有重要价值。

中文关键词: 叠加文字;场景文字;文字识别;显著性;深度神经网络

英文摘要: Accurately extracting and recognizing scene text and overlaid text in images and videos means a lot for computers and can be widely applied in many applications. In this project, we will systematically conduct reseaches on varous key techniques involved,including the localization, segmentation, rectification of scene text, the localization,segmentation of overlaid text, as well as the recogniton of characters imperfectly segmented out, and we will emphasize the theory innovation. The concrete research topics include: (1) the approach to detecting scene text based on graph model;(2)the techniques of detecting low-resolution scene text under complex lighting conditions if some priori knowledge is available;(3)an effective technique to implement edge detection and region segmentation in one body; (4) the rectification techques of scene text which has been distorted by the projective transform of cameras;(5)an unified approach to extracting both scene text and embedded text; (6)the approach to constructing recognition system with noisy input and a large number of class labels as ouput by redundant n-fork trees and graph model.The research topics of the project are tightly related with practical applications, and at the same time the potential research results are very valuable for enriching the fundamental theory

英文关键词: overlaid text;scene text;text recognition;saliency;deep neural networks

成为VIP会员查看完整内容
0

相关内容

「小样本深度学习图像识别」最新2022综述
专知会员服务
101+阅读 · 2022年1月15日
从视频到语言: 视频标题生成与描述研究综述
专知会员服务
19+阅读 · 2022年1月8日
场景图生成:一个全面综述
专知会员服务
63+阅读 · 2022年1月4日
专知会员服务
61+阅读 · 2021年8月4日
[CVPR 2021] 序列到序列对比学习的文本识别
专知会员服务
28+阅读 · 2021年4月14日
[CVPR 2020]BEDSR-Net:单张文档图像的阴影去除深度网络
专知会员服务
25+阅读 · 2020年9月29日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
英伟达给你工具,用Python识别车辆信息
机器之心
0+阅读 · 2021年12月8日
三年磨一剑——微信OCR图片文字提取
微信AI
0+阅读 · 2021年3月8日
白翔:复杂开放场景中的文本理解
深度学习大讲堂
12+阅读 · 2018年6月5日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
微信OCR(1)——公众号图文识别中的文本检测
微信AI
17+阅读 · 2017年11月22日
白翔:趣谈“捕文捉字”-- 场景文字检测 | VALSE2017之十
深度学习大讲堂
19+阅读 · 2017年9月4日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
13+阅读 · 2021年10月22日
Arxiv
14+阅读 · 2021年3月10日
小贴士
相关VIP内容
「小样本深度学习图像识别」最新2022综述
专知会员服务
101+阅读 · 2022年1月15日
从视频到语言: 视频标题生成与描述研究综述
专知会员服务
19+阅读 · 2022年1月8日
场景图生成:一个全面综述
专知会员服务
63+阅读 · 2022年1月4日
专知会员服务
61+阅读 · 2021年8月4日
[CVPR 2021] 序列到序列对比学习的文本识别
专知会员服务
28+阅读 · 2021年4月14日
[CVPR 2020]BEDSR-Net:单张文档图像的阴影去除深度网络
专知会员服务
25+阅读 · 2020年9月29日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员