项目名称: 图片视频中叠加文字提取识别技术研究

项目编号: No.60873087

项目类型: 面上项目

立项/批准年度: 2009

项目学科: 轻工业、手工业

项目作者: 王伟强

作者单位: 中国科学院大学

项目金额: 30万元

中文摘要: 准确提取识别嵌入在图片视频中的文字对于帮助计算机理解多媒体信息的语义具有重要的研究意义与应用前景。围绕该目标本项目将系统地研究涉及的各种关键技术,包括复杂背景中的文字检测、文字分割,以及非理想分割状况下的汉字识别,并从系统的角度优化各项技术的算法。在文字检测与分割方面,我们将重点研究笔画特征的描述表示,并希望将文字检测与分割算法有机结合在一起,通过特征信息共享优化整体算法性能。非理想分割结果下的汉字识别方法研究目前在国际上还是一个空白,我们以此为应用背景研究抗干扰的汉字识别特征,以及研究面对不确定性扰动的样本如何利用支持向量机SVM来建模求解大数目类别(6000多类)的分类问题。本项目的研究内容不仅与实践应用紧密相关,同时项目潜在的研究成果对丰富学科基础理论(支持向量机SVM求解大数据类分类问题)也具有重要价值。

中文关键词: 叠加文字; 文字检测; 文字提取; 文字识别

英文摘要: It is very significant to accurately extract embedded text in images and videos for computers to automatically understand the sementics of multimedia information. To this end, the project will systematically investigate various key technologise, including text detection, text segmentation in complex background, and robust character recognition under nonideal segmentation; at the same time the technologies will be optimized from the system perspective. For text detection and segmentation, we focus on the effective description and representation of strokes, and expect to integrate the detection and segmentation precedures together to share some feature information so as to improve the overall system performance. To our knowledge, few researches are reported on character recognition under nonideal segmention results. For the application, we investigate the related robust recognition features, and how to use SVM to model the problem of a large number of categories with noisy samples. The research contents of the project are tightly related with practical application, and at the same time the potential research results are very valuable for enriching the fundamental theory of machine learning ( the classification issue of using SVM to model a large number of categories with noisy samples).

英文关键词: embedded text;text detection; text extraction; character recognition

成为VIP会员查看完整内容
0

相关内容

视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
[ICCV 2021] 联合视觉语义推理:文本识别的多级解码器
专知会员服务
18+阅读 · 2021年11月28日
专知会员服务
8+阅读 · 2021年6月19日
[CVPR 2021] 序列到序列对比学习的文本识别
专知会员服务
28+阅读 · 2021年4月14日
专知会员服务
59+阅读 · 2021年4月11日
《深度学习》圣经花书的数学推导、原理与Python代码实现
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
三年磨一剑——微信OCR图片文字提取
微信AI
0+阅读 · 2021年3月8日
竞赛方案|VideoNet视频内容识别挑战赛
极市平台
14+阅读 · 2019年9月8日
一文读懂文本处理中的对抗训练
PaperWeekly
22+阅读 · 2019年6月5日
视频大脑:视频内容理解的技术与应用
AI前线
13+阅读 · 2019年4月18日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
文本识别 OCR 浅析:特征篇
开源中国
16+阅读 · 2018年1月6日
微信OCR(1)——公众号图文识别中的文本检测
微信AI
17+阅读 · 2017年11月22日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
10+阅读 · 2018年2月17日
小贴士
相关VIP内容
视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
[ICCV 2021] 联合视觉语义推理:文本识别的多级解码器
专知会员服务
18+阅读 · 2021年11月28日
专知会员服务
8+阅读 · 2021年6月19日
[CVPR 2021] 序列到序列对比学习的文本识别
专知会员服务
28+阅读 · 2021年4月14日
专知会员服务
59+阅读 · 2021年4月11日
《深度学习》圣经花书的数学推导、原理与Python代码实现
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
相关资讯
三年磨一剑——微信OCR图片文字提取
微信AI
0+阅读 · 2021年3月8日
竞赛方案|VideoNet视频内容识别挑战赛
极市平台
14+阅读 · 2019年9月8日
一文读懂文本处理中的对抗训练
PaperWeekly
22+阅读 · 2019年6月5日
视频大脑:视频内容理解的技术与应用
AI前线
13+阅读 · 2019年4月18日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
文本识别 OCR 浅析:特征篇
开源中国
16+阅读 · 2018年1月6日
微信OCR(1)——公众号图文识别中的文本检测
微信AI
17+阅读 · 2017年11月22日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员