成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
OCR
关注
1
综合
百科
VIP
热门
动态
论文
精华
Multimodal LLMs for OCR, OCR Post-Correction, and Named Entity Recognition in Historical Documents
Arxiv
0+阅读 · 4月1日
KAP: MLLM-assisted OCR Text Enhancement for Hybrid Retrieval in Chinese Non-Narrative Documents
Arxiv
0+阅读 · 3月11日
A Data-driven Investigation of Euphemistic Language: Comparing the usage of "slave" and "servant" in 19th century US newspapers
Arxiv
0+阅读 · 3月19日
Emergency-Brake Simplex: Toward A Verifiably Safe Control-CPS Architecture for Abrupt Runtime Reachability Constraint Changes
Arxiv
0+阅读 · 3月24日
Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription
Arxiv
0+阅读 · 2月27日
Reference-Based Post-OCR Processing with LLM for Precise Diacritic Text in Historical Document Recognition
Arxiv
0+阅读 · 2月27日
NusaAksara: A Multimodal and Multilingual Benchmark for Preserving Indonesian Indigenous Scripts
Arxiv
0+阅读 · 2月25日
Éclair -- Extracting Content and Layout with Integrated Reading Order for Documents
Arxiv
0+阅读 · 2月6日
CLOCR-C: Context Leveraging OCR Correction with Pre-trained Language Models
Arxiv
0+阅读 · 1月22日
KITAB-Bench: A Comprehensive Multi-Domain Benchmark for Arabic OCR and Document Understanding
Arxiv
0+阅读 · 2月20日
Reading the unreadable: Creating a dataset of 19th century English newspapers using image-to-text language models
Arxiv
0+阅读 · 2月18日
Online Fault Tolerance Strategy for Abrupt Reachability Constraint Changes
Arxiv
0+阅读 · 1月25日
Geometry Restoration and Dewarping of Camera-Captured Document Images
Arxiv
0+阅读 · 1月6日
Geometry Restoration and Dewarping of Camera-Captured Document Images
Arxiv
0+阅读 · 1月9日
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild
Arxiv
0+阅读 · 1月6日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top