成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
光学字符识别
关注
44
OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
综合
百科
VIP
热门
动态
论文
精华
Optical Character Recognition and Transcription of Berber Signs from Images in a Low-Resource Language Amazigh
Arxiv
0+阅读 · 2023年3月21日
Detection Masking for Improved OCR on Noisy Documents
Arxiv
0+阅读 · 2022年5月17日
An empirical study of CTC based models for OCR of Indian languages
Arxiv
1+阅读 · 2022年5月13日
OCR Synthetic Benchmark Dataset for Indic Languages
Arxiv
0+阅读 · 2022年5月5日
Unitail: Detecting, Reading, and Matching in Retail Scene
Arxiv
0+阅读 · 2022年5月2日
Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach
Arxiv
0+阅读 · 2022年4月27日
German Parliamentary Corpus (GerParCor)
Arxiv
0+阅读 · 2022年4月21日
DiT: Self-supervised Pre-training for Document Image Transformer
Arxiv
0+阅读 · 2022年4月12日
Unitail: Detecting, Reading, and Matching in Retail Scene
Arxiv
0+阅读 · 2022年4月1日
Rerunning OCR: A Machine Learning Approach to Quality Assessment and Enhancement Prediction
Arxiv
0+阅读 · 2022年3月31日
Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach
Arxiv
0+阅读 · 2022年3月25日
Towards Escaping from Language Bias and OCR Error: Semantics-Centered Text Visual Question Answering
Arxiv
1+阅读 · 2022年3月24日
OCR Improves Machine Translation for Low-Resource Languages
Arxiv
0+阅读 · 2022年3月13日
Language Matters: A Weakly Supervised Pre-training Approach for Scene Text Detection and Spotting
Arxiv
0+阅读 · 2022年3月8日
OCR quality affects perceived usefulness of historical newspaper clippings -- a user study
Arxiv
0+阅读 · 2022年3月4日
参考链接
父主题
计算机视觉
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top