成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
OCR
关注
1
综合
百科
VIP
热门
动态
论文
精华
Deciphering the Underserved: Benchmarking LLM OCR for Low-Resource Scripts
Arxiv
0+阅读 · 12月20日
Towards Deployable OCR models for Indic languages
Arxiv
0+阅读 · 12月18日
DoPTA: Improving Document Layout Analysis using Patch-Text Alignment
Arxiv
0+阅读 · 12月17日
One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments
Arxiv
0+阅读 · 12月13日
Assessing GPT Model Uncertainty in Mathematical OCR Tasks via Entropy Analysis
Arxiv
0+阅读 · 12月8日
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy
Arxiv
0+阅读 · 12月5日
Text Change Detection in Multilingual Documents Using Image Comparison
Arxiv
0+阅读 · 12月5日
Assessing GPT Model Uncertainty in Mathematical OCR Tasks via Entropy Analysis
Arxiv
0+阅读 · 12月2日
OCR Hinders RAG: Evaluating the Cascading Impact of OCR on Retrieval-Augmented Generation
Arxiv
0+阅读 · 12月3日
Unraveling Movie Genres through Cross-Attention Fusion of Bi-Modal Synergy of Poster
Arxiv
0+阅读 · 11月30日
DriveThru: a Document Extraction Platform and Benchmark Datasets for Indonesian Local Language Archives
Arxiv
0+阅读 · 11月15日
DriveThru: a Document Extraction Platform and Benchmark Datasets for Indonesian Local Language Archives
Arxiv
0+阅读 · 11月14日
Enhancing ASR Performance through OCR Word Frequency Analysis: Theoretical Foundations
Arxiv
0+阅读 · 11月9日
TAP-VL: Text Layout-Aware Pre-training for Enriched Vision-Language Models
Arxiv
1+阅读 · 11月7日
Handwriting Recognition in Historical Documents with Multimodal LLM
Arxiv
1+阅读 · 10月31日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top