CVPR 2020文档图像分析与识别相关论文22篇分类简介 - 专知

会员服务 ·

0

CVPR 2020文档图像分析与识别相关论文22篇分类简介

2020 年 7 月 10 日 专知

今年CVPR与STR（场景文字识别）或DAR（文档图像分析与识别）相关的论文共22篇，相比于去年（CVPR 2019，17篇）增加了5篇，表明此领域的研究热度在持续增加。

CVPR 2020论文PDF全文已经可在官方网站下载，链接如下：

http://openaccess.thecvf.com/CVPR2020.py

本文按场景文字检测、场景文字识别、文本数据合成、手写文字分析与识别、文档图像版面分析、文本VQA等十个类别对这22篇论文进行了分类梳理，简介如下（标*的论文表示该论文方法的代码已开源，共有9篇论文的代码已经开源，另外1篇论文公开了数据集）。

1

场景文字检测（2篇）

0 1

Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection*

0 2

ContourNet: Taking a Further Step Toward Accurate Arbitrary-Shaped Scene Text Detection*

2

场景文字识别（4篇）

03

SCATTER：Selective Context Attentional Scene Text Recognizer

04

Towards Accurate Scene Text Recognition With Semantic Reasoning Networks

05

SEED ： Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition*

06

On Vocabulary Reliance in Scene Text Recognition

3

端到端文字检测+识别（1篇）

07

ABCNet： Real-Time Scene Text Spotting With Adaptive Bezier-Curve Networ k *

4

场景文字识别对抗攻击（1篇）

08

What Machines See Is Not What They Get：Fooling Scene Text Recognition Models With Adversarial Text Images

5

文本数据合成/数据增广/风格迁移/场景文字编辑（5篇）

09

ScrabbleGAN：Semi-Supervised Varying Length Handwritten Text Generation

10

Learn to Augment：Joint Data Augmentation and Network Optimization for Text Recognition*

11

UnrealText: Synthesizing Realistic Scene Text Images From the Unreal World*

12

SwapText: Image Based Texts Transfer in Scenes

13

STEFANN: Scene Text Editor Using Font Adaptive Neural Network*

6

文档图像处理（去阴影、碎片文档重构）（2篇）

14

BEDSR-Net: A Deep Shadow Removal Network From a Single Document Image （文中提到：本文数据集及代码将开源）

15

Fast(er) Reconstruction of Shredded Text Documents via Self-Supervised Deep Asymmetric Metric Learning

7

手写文字分析与识别（2篇）

16

Sequential Motif Profiles and Topological Plots for Offline Signature Verification

17

OrigamiNet: Weakly-Supervised, Segmentation-Free, One-Step, Full Page Text Recognition by learning to unfold*

8

文档图像版面分析（1篇）

18

Cross-Domain Document Object Detection: Benchmark Suite and Method

9

文本VQA（3篇）

19

On the General Value of Evidence, and Bilingual Scene-Text Visual Question Answering （数据集已公开）

20

Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text

21

Iterative Answer Prediction With Pointer-Augmented Multimodal Transformers for TextVQA

10

其它（1篇）

下面这篇论文严格来说是并不是OCR或DAR领域的论文（属于计算机视觉及图像处理基础化技术的论文)，但鉴于MSER曾经是文字检测领域最重要的方法之一，故小编也把此文列入。

22

Fast MSER*

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

欢迎扫一扫关注专知视频号，第一时间看人工智能最新精彩视频！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

2

相关内容

图像分析

近期必读的六篇计算机视觉顶会ECCV 2020【目标检测】相关论文

近期必读的六篇计算机视觉顶会ECCV 2020【目标检测】相关论文

专知会员服务

59+阅读 · 2020年7月7日

近期必读的5篇顶会CVPR 2020【场景图+图神经网络（SG+GNN）】相关论文

近期必读的5篇顶会CVPR 2020【场景图+图神经网络（SG+GNN）】相关论文

专知会员服务

51+阅读 · 2020年5月12日

近期必读的6篇CVPR 2020【域自适应（Domain Adaptation）】相关论文和代码

近期必读的6篇CVPR 2020【域自适应（Domain Adaptation）】相关论文和代码

专知会员服务

96+阅读 · 2020年3月24日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文

近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文

专知会员服务

79+阅读 · 2020年3月3日

近期必读的7篇【医学图像分割】相关论文和代码（CVPR、AAAI）

近期必读的7篇【医学图像分割】相关论文和代码（CVPR、AAAI）

专知会员服务

41+阅读 · 2020年1月10日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

26+阅读 · 2019年10月24日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

AAAI2020 图相关论文集

AAAI2020 图相关论文集

图与推荐

11+阅读 · 2020年7月15日

CVPR2020接收论文开源代码

CVPR2020接收论文开源代码

专知

30+阅读 · 2020年2月29日

CVPR 2019 论文大盘点-人脸技术篇

CVPR 2019 论文大盘点-人脸技术篇

极市平台

20+阅读 · 2019年6月21日

CVPR2019| 05-07更新14篇论文及代码合集（1篇oral，含目标检测/视频分割/目标跟踪等）

CVPR2019| 05-07更新14篇论文及代码合集（1篇oral，含目标检测/视频分割/目标跟踪等）

极市平台

22+阅读 · 2019年5月7日

CVPR2019| 04-22更新19篇论文及代码（2篇oral，含物体检测、动作识别、医学影像等）

CVPR2019| 04-22更新19篇论文及代码（2篇oral，含物体检测、动作识别、医学影像等）

极市平台

13+阅读 · 2019年4月22日

CVPR2019| 04-16更新48篇论文及代码（9篇oral、含行人检测、图像生成、步态识别等）

CVPR2019| 04-16更新48篇论文及代码（9篇oral、含行人检测、图像生成、步态识别等）

极市平台

33+阅读 · 2019年4月16日

Github项目推荐 | 语义分割、实例分割、全景分割和视频分割的论文和基准列表

Github项目推荐 | 语义分割、实例分割、全景分割和视频分割的论文和基准列表

AI研习社

32+阅读 · 2019年4月5日

CVPR2019 | 03-13日更新16篇论文及代码汇总（行人重识别、人体姿态估计、GAN、手写体识别等）

CVPR2019 | 03-13日更新16篇论文及代码汇总（行人重识别、人体姿态估计、GAN、手写体识别等）

极市平台

7+阅读 · 2019年3月13日

上百份文字的检测与识别资源，包含数据集、code和paper

上百份文字的检测与识别资源，包含数据集、code和paper

数据挖掘入门与实战

17+阅读 · 2017年12月7日

2017-最全手势识别/跟踪相关资源大列表分享（论文、数据集、比赛等）

2017-最全手势识别/跟踪相关资源大列表分享（论文、数据集、比赛等）

深度学习与NLP

64+阅读 · 2017年10月29日

Image Segmentation Using Deep Learning: A Survey

Image Segmentation Using Deep Learning: A Survey

Arxiv

47+阅读 · 2020年1月15日

Deep Co-Training for Semi-Supervised Image Segmentation

Deep Co-Training for Semi-Supervised Image Segmentation

Arxiv

6+阅读 · 2019年10月30日

A Survey and Taxonomy of Adversarial Neural Networks for Text-to-Image Synthesis

A Survey and Taxonomy of Adversarial Neural Networks for Text-to-Image Synthesis

Arxiv

7+阅读 · 2019年10月21日

Relation-Aware Graph Attention Network for Visual Question Answering

Relation-Aware Graph Attention Network for Visual Question Answering

Arxiv

7+阅读 · 2019年10月9日

Visual Question Answering using Deep Learning: A Survey and Performance Analysis

Arxiv

4+阅读 · 2019年8月27日

Graph Convolutional Networks for Text Classification

Arxiv

12+阅读 · 2018年9月15日

Panoptic Segmentation with a Joint Semantic and Instance Segmentation Network

Panoptic Segmentation with a Joint Semantic and Instance Segmentation Network

Arxiv

5+阅读 · 2018年9月6日

From VQA to Multimodal CQA: Adapting Visual QA Models for Community QA Tasks

From VQA to Multimodal CQA: Adapting Visual QA Models for Community QA Tasks

Arxiv

8+阅读 · 2018年8月29日

Simple and Effective Semi-Supervised Question Answering

Arxiv

5+阅读 · 2018年4月2日

VQA: Visual Question Answering

Arxiv

9+阅读 · 2016年10月27日

VIP会员

相关主题

相关VIP内容

近期必读的六篇计算机视觉顶会ECCV 2020【目标检测】相关论文

近期必读的六篇计算机视觉顶会ECCV 2020【目标检测】相关论文

专知会员服务

59+阅读 · 2020年7月7日

近期必读的5篇顶会CVPR 2020【场景图+图神经网络（SG+GNN）】相关论文

近期必读的5篇顶会CVPR 2020【场景图+图神经网络（SG+GNN）】相关论文

专知会员服务

51+阅读 · 2020年5月12日

近期必读的6篇CVPR 2020【域自适应（Domain Adaptation）】相关论文和代码

近期必读的6篇CVPR 2020【域自适应（Domain Adaptation）】相关论文和代码

专知会员服务

96+阅读 · 2020年3月24日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文

近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文

专知会员服务

79+阅读 · 2020年3月3日

近期必读的7篇【医学图像分割】相关论文和代码（CVPR、AAAI）

近期必读的7篇【医学图像分割】相关论文和代码（CVPR、AAAI）

专知会员服务

41+阅读 · 2020年1月10日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

26+阅读 · 2019年10月24日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

AAAI2020 图相关论文集

AAAI2020 图相关论文集

图与推荐

11+阅读 · 2020年7月15日

CVPR2020接收论文开源代码

CVPR2020接收论文开源代码

专知

30+阅读 · 2020年2月29日

CVPR 2019 论文大盘点-人脸技术篇

CVPR 2019 论文大盘点-人脸技术篇

极市平台

20+阅读 · 2019年6月21日

CVPR2019| 05-07更新14篇论文及代码合集（1篇oral，含目标检测/视频分割/目标跟踪等）

CVPR2019| 05-07更新14篇论文及代码合集（1篇oral，含目标检测/视频分割/目标跟踪等）

极市平台

22+阅读 · 2019年5月7日

CVPR2019| 04-22更新19篇论文及代码（2篇oral，含物体检测、动作识别、医学影像等）

CVPR2019| 04-22更新19篇论文及代码（2篇oral，含物体检测、动作识别、医学影像等）

极市平台

13+阅读 · 2019年4月22日

CVPR2019| 04-16更新48篇论文及代码（9篇oral、含行人检测、图像生成、步态识别等）

CVPR2019| 04-16更新48篇论文及代码（9篇oral、含行人检测、图像生成、步态识别等）

极市平台

33+阅读 · 2019年4月16日

Github项目推荐 | 语义分割、实例分割、全景分割和视频分割的论文和基准列表

Github项目推荐 | 语义分割、实例分割、全景分割和视频分割的论文和基准列表

AI研习社

32+阅读 · 2019年4月5日

CVPR2019 | 03-13日更新16篇论文及代码汇总（行人重识别、人体姿态估计、GAN、手写体识别等）

CVPR2019 | 03-13日更新16篇论文及代码汇总（行人重识别、人体姿态估计、GAN、手写体识别等）

极市平台

7+阅读 · 2019年3月13日

上百份文字的检测与识别资源，包含数据集、code和paper

上百份文字的检测与识别资源，包含数据集、code和paper

数据挖掘入门与实战

17+阅读 · 2017年12月7日

2017-最全手势识别/跟踪相关资源大列表分享（论文、数据集、比赛等）

2017-最全手势识别/跟踪相关资源大列表分享（论文、数据集、比赛等）

深度学习与NLP

64+阅读 · 2017年10月29日

相关论文

Image Segmentation Using Deep Learning: A Survey

Image Segmentation Using Deep Learning: A Survey

Arxiv

47+阅读 · 2020年1月15日

Deep Co-Training for Semi-Supervised Image Segmentation

Deep Co-Training for Semi-Supervised Image Segmentation

Arxiv

6+阅读 · 2019年10月30日

A Survey and Taxonomy of Adversarial Neural Networks for Text-to-Image Synthesis

A Survey and Taxonomy of Adversarial Neural Networks for Text-to-Image Synthesis

Arxiv

7+阅读 · 2019年10月21日

Relation-Aware Graph Attention Network for Visual Question Answering

Relation-Aware Graph Attention Network for Visual Question Answering

Arxiv

7+阅读 · 2019年10月9日

Visual Question Answering using Deep Learning: A Survey and Performance Analysis

Arxiv

4+阅读 · 2019年8月27日

Graph Convolutional Networks for Text Classification

Arxiv

12+阅读 · 2018年9月15日

Panoptic Segmentation with a Joint Semantic and Instance Segmentation Network

Panoptic Segmentation with a Joint Semantic and Instance Segmentation Network

Arxiv

5+阅读 · 2018年9月6日

From VQA to Multimodal CQA: Adapting Visual QA Models for Community QA Tasks

From VQA to Multimodal CQA: Adapting Visual QA Models for Community QA Tasks

Arxiv

8+阅读 · 2018年8月29日

Simple and Effective Semi-Supervised Question Answering

Arxiv

5+阅读 · 2018年4月2日

VQA: Visual Question Answering

Arxiv

9+阅读 · 2016年10月27日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

精排模型-从MLP到行为序列：DIN、DIEN、MIMN、SIM、DSIN

微信扫码咨询专知VIP会员