The digitization of structured handwritten documents, such as academic marksheets, remains a significant challenge due to the dual complexity of irregular table structures and diverse handwriting styles. While recent Transformer-based approaches like TableNet and TrOCR achieve state-of-the-art accuracy, their high computational cost renders them unsuitable for resource-constrained edge deployments. This paper introduces a resource-efficient hybrid framework that integrates a heuristic OpenCV-based pipeline for rapid table structure detection with a modified lightweight YOLOv8 architecture for handwritten character recognition. By strategically removing the SPPF and deep C2f layers from the standard YOLOv8 backbone, we reduce computational overhead while maintaining high recognition fidelity. Experimental results on the EMNIST digit benchmark demonstrate that our Modified YOLOv8 model achieves 97.5% accuracy. Furthermore, we provide a comprehensive efficiency analysis showing that our framework offers a 95 times inference speedup over standard OCR pipelines and massive efficiency gains over emerging Large Multimodal Models (LMMs) like Qwen2.5-VL, achieving real-time performance 29 FPS on standard CPU hardware. A qualitative and quantitative evaluation on the AMES dataset, a challenging subset of real-world marksheets, confirms the system's robustness in handling mixed alphanumeric content, bridging the gap between high-performance deep learning and practical, scalable document automation.


翻译:结构化手写文档(如学术成绩单)的数字化,由于不规则的表格结构和多样化的手写风格双重复杂性,仍然是一项重大挑战。尽管近期基于Transformer的方法(如TableNet和TrOCR)实现了最先进的精度,但其高昂的计算成本使其不适用于资源受限的边缘部署场景。本文提出了一种资源高效的混合框架,该框架集成了基于OpenCV的启发式流水线用于快速表格结构检测,并结合了改进的轻量级YOLOv8架构用于手写字符识别。通过策略性地从标准YOLOv8骨干网络中移除SPPF层和深层C2f层,我们在保持高识别保真度的同时降低了计算开销。在EMNIST数字基准测试上的实验结果表明,我们的改进型YOLOv8模型达到了97.5%的准确率。此外,我们提供了全面的效率分析,显示我们的框架相比标准OCR流水线实现了95倍的推理加速,相比新兴的大型多模态模型(如Qwen2.5-VL)获得了巨大的效率提升,在标准CPU硬件上达到了29 FPS的实时性能。在AMES数据集(一个具有挑战性的真实世界成绩单子集)上进行的定性与定量评估证实了该系统在处理混合字母数字内容方面的鲁棒性,从而弥合了高性能深度学习与实际可扩展文档自动化之间的鸿沟。

0
下载
关闭预览

相关内容

专知会员服务
41+阅读 · 2021年6月19日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员