项目名称: 手写中文文本识别的高扩展判别学习理论和方法

项目编号: No.61203260

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 自动化学科

项目作者: 苏统华

作者单位: 哈尔滨工业大学

项目金额: 24万元

中文摘要: 手写汉字识别是模式识别领域的重要分支,作为电子化中文文档的利器,对于整个国家具有战略意义。手写中文文本识别是最自然的汉字输入技术之一,但面临严峻的性能瓶颈。海量训练数据和判别学习都有助于性能的提升,却存在巨大的计算复杂度。本项目旨在从理论、算法和实现三个层面上设计基于分布式计算环境的高扩展判别学习方法。研究内容包括:1)建立当前最先进的基准识别系统,特别提出一种新颖的轻量级隐马尔可夫模型;2)研究分布式判别学习理论框架,支持对算法的收敛性、泛化界和复杂度的分析;3)研究生成式基准系统的分布式判别学习方法,在扩展当前计算模型的基础上,实现手写中文文本识别系统的分布式判别学习。本项目将建立具有鲜明特色的分布式判别学习的完整体系;提出针对大类别序列模式判别学习的一系列创新方法。最终解决手写中文文本识别的性能和效率双重瓶颈,并得到可推广到其它领域的重要成果。

中文关键词: 手写汉字识别;判别学习;GPU计算;原型学习;大类别序列标记

英文摘要: Handwritten Chinese character recognition is an important branch of pattern recognition field and is of strategic significance to national document transcription. As one of the most natural interfaces, however, handwritten text recognition faces great challenges due to its limited performance. Both using massive training data and discriminatively training the recognition models do help, if we can outlook the heavy burden in computation. This project studies the theory, algorithm, and implementation aspects of distributed discriminative learning for sequential labeling tasks. The issues undertaken include: 1) Proposing a novel light-weight hidden Markov model-based recognition system; 2) Establishing theoretical framework for distributed discriminative learning, and deriving the algorithms' convergence, generalization and complexity; 3) Developing more concrete computational models for baseline recognition systems, and deploying them using distributed discriminative learning. The expected main contributions of the project lie in: 1) Comprehensive theoretical guarantees for distributed discriminative learning; 2) Innovative methods for large-category pattern recognition using discriminative learning techniques. The outputs of the project may resolve both the performance bottleneck and the efficacy bottleneck, a

英文关键词: Handwritten Chinese Character Recognition;Discriminative Learning;GPU Computing;Prototype Learning;Large-category Sequential Labeling

成为VIP会员查看完整内容
0

相关内容

专知会员服务
15+阅读 · 2021年10月11日
专知会员服务
68+阅读 · 2021年8月20日
专知会员服务
96+阅读 · 2021年8月13日
专知会员服务
26+阅读 · 2021年7月11日
【中科院自动化所刘成林研究员】跨模态零样本文字识别
[CVPR 2021] 序列到序列对比学习的文本识别
专知会员服务
28+阅读 · 2021年4月14日
中科大《计算机体系结构》2021课程,附课件
专知会员服务
75+阅读 · 2021年4月4日
【CVPR2020-港中文】 图像识别中的自注意力探索
专知会员服务
55+阅读 · 2020年4月29日
【喜讯】CSIG常务理事刘成林研究员荣获2020年度国家自然科学奖二等奖
免费中文书籍-《神经网络与深度学习》中文版推荐
深度学习与NLP
20+阅读 · 2019年4月2日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
中文自然语言处理入门实战
人工智能头条
14+阅读 · 2019年1月11日
人工智能对网络空间安全的影响
走向智能论坛
21+阅读 · 2018年6月7日
TensorFlow实例: 手写汉字识别
数据挖掘入门与实战
11+阅读 · 2017年11月10日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月16日
小贴士
相关VIP内容
专知会员服务
15+阅读 · 2021年10月11日
专知会员服务
68+阅读 · 2021年8月20日
专知会员服务
96+阅读 · 2021年8月13日
专知会员服务
26+阅读 · 2021年7月11日
【中科院自动化所刘成林研究员】跨模态零样本文字识别
[CVPR 2021] 序列到序列对比学习的文本识别
专知会员服务
28+阅读 · 2021年4月14日
中科大《计算机体系结构》2021课程,附课件
专知会员服务
75+阅读 · 2021年4月4日
【CVPR2020-港中文】 图像识别中的自注意力探索
专知会员服务
55+阅读 · 2020年4月29日
相关资讯
【喜讯】CSIG常务理事刘成林研究员荣获2020年度国家自然科学奖二等奖
免费中文书籍-《神经网络与深度学习》中文版推荐
深度学习与NLP
20+阅读 · 2019年4月2日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
中文自然语言处理入门实战
人工智能头条
14+阅读 · 2019年1月11日
人工智能对网络空间安全的影响
走向智能论坛
21+阅读 · 2018年6月7日
TensorFlow实例: 手写汉字识别
数据挖掘入门与实战
11+阅读 · 2017年11月10日
相关基金
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员