成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
OCR(光学字符识别)
关注
231
OCR(光学字符识别)
综合
百科
荟萃
VIP
热门
动态
论文
精华
TAP-VL: Text Layout-Aware Pre-training for Enriched Vision-Language Models
Arxiv
0+阅读 · 11月7日
POINTS: Improving Your Vision-language Model with Affordable Strategies
Arxiv
0+阅读 · 11月5日
Chronicling Germany: An Annotated Historical Newspaper Dataset
Arxiv
0+阅读 · 10月25日
Robust Loop Closure by Textual Cues in Challenging Environments
Arxiv
0+阅读 · 10月21日
Are VLMs Really Blind
Arxiv
0+阅读 · 10月29日
POINTS: Improving Your Vision-language Model with Affordable Strategies
Arxiv
0+阅读 · 9月14日
POINTS: Improving Your Vision-language Model with Affordable Strategies
Arxiv
0+阅读 · 9月7日
OCRBench: On the Hidden Mystery of OCR in Large Multimodal Models
Arxiv
0+阅读 · 8月26日
Toward accessible comics for blind and low vision readers
Arxiv
0+阅读 · 9月10日
Ancient but Digitized: Developing Handwritten Optical Character Recognition for East Syriac Script Through Creating KHAMIS Dataset
Arxiv
0+阅读 · 8月24日
FastTextSpotter: A High-Efficiency Transformer for Multilingual Scene Text Spotting
Arxiv
0+阅读 · 8月27日
Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese
Arxiv
0+阅读 · 8月23日
Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese
Arxiv
0+阅读 · 8月22日
On the Hidden Mystery of OCR in Large Multimodal Models
Arxiv
0+阅读 · 8月14日
Vision Language Models for Spreadsheet Understanding: Challenges and Opportunities
Arxiv
0+阅读 · 8月9日
参考链接
父主题
文字识别
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top