图片视频中叠加文字提取识别技术研究 - 专知基金

会员服务 ·

0

叠加文字 · 文字检测 ·

2008 年 12 月 31 日

图片视频中叠加文字提取识别技术研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 图片视频中叠加文字提取识别技术研究

项目编号： No.60873087

项目类型： 面上项目

立项/批准年度： 2009

项目学科： 轻工业、手工业

项目作者： 王伟强

作者单位： 中国科学院大学

项目金额： 30万元

中文摘要： 准确提取识别嵌入在图片视频中的文字对于帮助计算机理解多媒体信息的语义具有重要的研究意义与应用前景。围绕该目标本项目将系统地研究涉及的各种关键技术，包括复杂背景中的文字检测、文字分割，以及非理想分割状况下的汉字识别，并从系统的角度优化各项技术的算法。在文字检测与分割方面，我们将重点研究笔画特征的描述表示，并希望将文字检测与分割算法有机结合在一起，通过特征信息共享优化整体算法性能。非理想分割结果下的汉字识别方法研究目前在国际上还是一个空白，我们以此为应用背景研究抗干扰的汉字识别特征，以及研究面对不确定性扰动的样本如何利用支持向量机SVM来建模求解大数目类别(6000多类)的分类问题。本项目的研究内容不仅与实践应用紧密相关，同时项目潜在的研究成果对丰富学科基础理论(支持向量机SVM求解大数据类分类问题)也具有重要价值。

中文关键词： 叠加文字；文字检测；文字提取；文字识别

英文摘要： It is very significant to accurately extract embedded text in images and videos for computers to automatically understand the sementics of multimedia information. To this end, the project will systematically investigate various key technologise, including text detection, text segmentation in complex background, and robust character recognition under nonideal segmentation; at the same time the technologies will be optimized from the system perspective. For text detection and segmentation, we focus on the effective description and representation of strokes, and expect to integrate the detection and segmentation precedures together to share some feature information so as to improve the overall system performance. To our knowledge, few researches are reported on character recognition under nonideal segmention results. For the application, we investigate the related robust recognition features, and how to use SVM to model the problem of a large number of categories with noisy samples. The research contents of the project are tightly related with practical application, and at the same time the potential research results are very valuable for enriching the fundamental theory of machine learning ( the classification issue of using SVM to model a large number of categories with noisy samples).

英文关键词： embedded text；text detection; text extraction; character recognition

成为VIP会员查看完整内容

0

相关内容

叠加文字

视频隐私保护技术综述

视频隐私保护技术综述

专知会员服务

35+阅读 · 2022年1月19日

[ICCV 2021] 联合视觉语义推理：文本识别的多级解码器

[ICCV 2021] 联合视觉语义推理：文本识别的多级解码器

专知会员服务

19+阅读 · 2021年11月28日

【ICML2021】生成式视频转换器Transformers: 物体可以是文字吗?

专知会员服务

13+阅读 · 2021年8月20日

ICML 2021 | 基于装配的视频无监督部件分割

专知会员服务

9+阅读 · 2021年6月19日

[CVPR 2021] 序列到序列对比学习的文本识别

[CVPR 2021] 序列到序列对比学习的文本识别

专知会员服务

29+阅读 · 2021年4月14日

计算机视觉中的自监督学习与注意力建模

专知会员服务

60+阅读 · 2021年4月11日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

325+阅读 · 2020年3月6日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

图像内容自动描述技术综述

图像内容自动描述技术综述

专知会员服务

88+阅读 · 2019年11月17日

三年磨一剑——微信OCR图片文字提取

三年磨一剑——微信OCR图片文字提取

微信AI

0+阅读 · 2021年3月8日

竞赛方案|VideoNet视频内容识别挑战赛

竞赛方案|VideoNet视频内容识别挑战赛

极市平台

14+阅读 · 2019年9月8日

一文读懂文本处理中的对抗训练

一文读懂文本处理中的对抗训练

PaperWeekly

22+阅读 · 2019年6月5日

视频大脑：视频内容理解的技术与应用

视频大脑：视频内容理解的技术与应用

AI前线

13+阅读 · 2019年4月18日

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

专知

14+阅读 · 2019年4月17日

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

人工智能前沿讲习班

12+阅读 · 2018年12月25日

生成对抗网络的研究进展与趋势

生成对抗网络的研究进展与趋势

中国计算机学会

35+阅读 · 2018年11月14日

文本识别 OCR 浅析：特征篇

文本识别 OCR 浅析：特征篇

开源中国

16+阅读 · 2018年1月6日

微信OCR(1)——公众号图文识别中的文本检测

微信OCR(1)——公众号图文识别中的文本检测

微信AI

17+阅读 · 2017年11月22日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

傣族贝叶经字符提取与识别研究

国家自然科学基金

0+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

人脸图像的身份和表情同步识别方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于信息融合的维吾尔文联机手写单词识别技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于图模型的场景文字与叠加文字提取识别技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于词袋模型的多特征融合物体识别方法研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于表观特征的目标人体识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于多视图的网络视频流不良内容在线识别研究

国家自然科学基金

0+阅读 · 2009年12月31日

Generative or Contrastive? Phrase Reconstruction for Better Sentence Representation Learning

Arxiv

0+阅读 · 2022年4月20日

Can Human Sex Be Learned Using Only 2D Body Keypoint Estimations?

Arxiv

0+阅读 · 2022年4月20日

NTIRE 2022 Challenge on Stereo Image Super-Resolution: Methods and Results

Arxiv

0+阅读 · 2022年4月20日

Auxiliary Loss Reweighting for Image Inpainting

Arxiv

0+阅读 · 2022年4月20日

NAFSSR: Stereo Image Super-Resolution Using NAFNet

Arxiv

0+阅读 · 2022年4月19日

WhyGen: Explaining ML-powered Code Generation by Referring to Training Examples

Arxiv

0+阅读 · 2022年4月17日

A Contrastive Cross-Channel Data Augmentation Framework for Aspect-based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月16日

ImGAGN:Imbalanced Network Embedding via Generative Adversarial Graph Networks

Arxiv

14+阅读 · 2021年6月5日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

10+阅读 · 2018年2月17日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

热门VIP内容

开通专知VIP会员享更多权益服务

《代码、指挥与冲突：描绘军事人工智能的未来》报告

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

美国启动“自有军事人工智能计划”：采用谷歌Gemini以推动全军人工智能应用

《创新与适应性作为军事成功的关键因素：来自俄乌战争的战略洞见》报告

相关VIP内容

视频隐私保护技术综述

视频隐私保护技术综述

专知会员服务

35+阅读 · 2022年1月19日

[ICCV 2021] 联合视觉语义推理：文本识别的多级解码器

[ICCV 2021] 联合视觉语义推理：文本识别的多级解码器

专知会员服务

19+阅读 · 2021年11月28日

【ICML2021】生成式视频转换器Transformers: 物体可以是文字吗?

专知会员服务

13+阅读 · 2021年8月20日

ICML 2021 | 基于装配的视频无监督部件分割

专知会员服务

9+阅读 · 2021年6月19日

[CVPR 2021] 序列到序列对比学习的文本识别

[CVPR 2021] 序列到序列对比学习的文本识别

专知会员服务

29+阅读 · 2021年4月14日

计算机视觉中的自监督学习与注意力建模

专知会员服务

60+阅读 · 2021年4月11日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

325+阅读 · 2020年3月6日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

图像内容自动描述技术综述

图像内容自动描述技术综述

专知会员服务

88+阅读 · 2019年11月17日

相关资讯

三年磨一剑——微信OCR图片文字提取

三年磨一剑——微信OCR图片文字提取

微信AI

0+阅读 · 2021年3月8日

竞赛方案|VideoNet视频内容识别挑战赛

竞赛方案|VideoNet视频内容识别挑战赛

极市平台

14+阅读 · 2019年9月8日

一文读懂文本处理中的对抗训练

一文读懂文本处理中的对抗训练

PaperWeekly

22+阅读 · 2019年6月5日

视频大脑：视频内容理解的技术与应用

视频大脑：视频内容理解的技术与应用

AI前线

13+阅读 · 2019年4月18日

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

专知

14+阅读 · 2019年4月17日

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

人工智能前沿讲习班

12+阅读 · 2018年12月25日

生成对抗网络的研究进展与趋势

生成对抗网络的研究进展与趋势

中国计算机学会

35+阅读 · 2018年11月14日

文本识别 OCR 浅析：特征篇

文本识别 OCR 浅析：特征篇

开源中国

16+阅读 · 2018年1月6日

微信OCR(1)——公众号图文识别中的文本检测

微信OCR(1)——公众号图文识别中的文本检测

微信AI

17+阅读 · 2017年11月22日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

相关基金

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

傣族贝叶经字符提取与识别研究

国家自然科学基金

0+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

人脸图像的身份和表情同步识别方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于信息融合的维吾尔文联机手写单词识别技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于图模型的场景文字与叠加文字提取识别技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于词袋模型的多特征融合物体识别方法研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于表观特征的目标人体识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于多视图的网络视频流不良内容在线识别研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Generative or Contrastive? Phrase Reconstruction for Better Sentence Representation Learning

Arxiv

0+阅读 · 2022年4月20日

Can Human Sex Be Learned Using Only 2D Body Keypoint Estimations?

Arxiv

0+阅读 · 2022年4月20日

NTIRE 2022 Challenge on Stereo Image Super-Resolution: Methods and Results

Arxiv

0+阅读 · 2022年4月20日

Auxiliary Loss Reweighting for Image Inpainting

Arxiv

0+阅读 · 2022年4月20日

NAFSSR: Stereo Image Super-Resolution Using NAFNet

Arxiv

0+阅读 · 2022年4月19日

WhyGen: Explaining ML-powered Code Generation by Referring to Training Examples

Arxiv

0+阅读 · 2022年4月17日

A Contrastive Cross-Channel Data Augmentation Framework for Aspect-based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月16日

ImGAGN:Imbalanced Network Embedding via Generative Adversarial Graph Networks

Arxiv

14+阅读 · 2021年6月5日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

10+阅读 · 2018年2月17日

微信扫码咨询专知VIP会员