[CVPR 2021] 序列到序列对比学习的文本识别 - 专知VIP

会员服务 ·

0

文本识别 · 序列建模 · 对比学习 ·

2021 年 4 月 14 日

[CVPR 2021] 序列到序列对比学习的文本识别

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文简要介绍CVPR2021录用论文“Sequence-to-Sequence Contrastive Learning for Text Recognition”的主要工作。该论文提出了一种针对文本识别，序列到序列对比学习的无监督方法SeqCLR。

无监督的对比学习方法在图像分类、目标检测和图像分割[1,2,3,4]中都取得不错的成果。但是无监督和半监督的方法在文本识别中还有待进一步探索。对于已有的无监督方法SimCLR[1]，它将整张图像作为对比学习中的输入元素，这种整图、非序列化的无监督方法从后文的实验中证明对文本识别的效果很差。所以本文提出了一个序列化的无监督方法SeqCLR，它从整张图片中映射出一定数量的实例来作为对比学习中的输入元素。图片

图1（a）目前的对比方法比较从整个图像中计算出的单个表示。（b）SeqCLR的对比方法比较从整个图像中计算出的多个表示。

本文的方法是第一个提出用于文本识别的自我监督表示学习的工作。通过在特征图中加窗产生正负样本来将文本图片序列化，这种方法在一些手写文本和场景文本数据集中取得不错的效果。

成为VIP会员查看完整内容

29

相关内容

文本识别

【KDD2021 】基于协同对比学习的自监督异质图神经网络

专知会员服务

38+阅读 · 2021年5月28日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

[CVPR 2021] 基于傅里叶轮廓嵌入的任意形状文本检测（有源码）

专知会员服务

18+阅读 · 2021年5月8日

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

专知会员服务

35+阅读 · 2021年4月8日

【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习

【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习

专知会员服务

27+阅读 · 2020年12月6日

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

专知会员服务

66+阅读 · 2020年10月20日

【NeurIPS2020】通过最大编码率降低原理学习多样和有判别性的表示

【NeurIPS2020】通过最大编码率降低原理学习多样和有判别性的表示

专知会员服务

15+阅读 · 2020年9月30日

【ICML2020】文本摘要生成模型PEGASUS

【ICML2020】文本摘要生成模型PEGASUS

专知会员服务

35+阅读 · 2020年8月23日

【CVPR2020】跨模态哈希的无监督知识蒸馏

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

【CVPR 2020-人大】层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】层次图推理的细粒度文本视频跨模态检索

专知

7+阅读 · 2020年4月5日

CVPR 2020 | 细粒度文本视频跨模态检索

CVPR 2020 | 细粒度文本视频跨模态检索

AI科技评论

17+阅读 · 2020年3月24日

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

AI科技评论

10+阅读 · 2019年12月23日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

AAAI 2019 | 选择型阅读理解问题上的空间卷积Attention模型

AAAI 2019 | 选择型阅读理解问题上的空间卷积Attention模型

PaperWeekly

5+阅读 · 2019年5月9日

利用神经网络进行序列到序列转换的学习

利用神经网络进行序列到序列转换的学习

AI研习社

12+阅读 · 2019年4月26日

行为识别（action recognition）目前的难点在哪？

行为识别（action recognition）目前的难点在哪？

极市平台

36+阅读 · 2019年2月14日

CVPR 2018 |“寻找”极小人脸

CVPR 2018 |“寻找”极小人脸

极市平台

14+阅读 · 2018年7月11日

CVPR 2018 | 自监督对抗哈希SSAH：当前最佳的跨模态检索框架

CVPR 2018 | 自监督对抗哈希SSAH：当前最佳的跨模态检索框架

机器之心

7+阅读 · 2018年4月14日

大会 | AAAI论文：基于强化学习循环查找受关注区域的多标签图像识别

大会 | AAAI论文：基于强化学习循环查找受关注区域的多标签图像识别

AI科技评论

4+阅读 · 2018年3月14日

Multi-Window Data Augmentation Approach for Speech Emotion Recognition

Arxiv

0+阅读 · 2021年6月2日

Attributes-Guided and Pure-Visual Attention Alignment for Few-Shot Recognition

Arxiv

8+阅读 · 2020年12月4日

Equalization Loss for Long-Tailed Object Recognition

Equalization Loss for Long-Tailed Object Recognition

Arxiv

5+阅读 · 2020年4月14日

Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

Arxiv

7+阅读 · 2020年3月19日

Learning Meta Face Recognition in Unseen Domains

Arxiv

5+阅读 · 2020年3月17日

Exploring RNN-Transducer for Chinese Speech Recognition

Arxiv

4+阅读 · 2019年4月23日

Open Set Chinese Character Recognition using Multi-typed Attributes

Open Set Chinese Character Recognition using Multi-typed Attributes

Arxiv

4+阅读 · 2018年8月27日

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Arxiv

4+阅读 · 2018年5月21日

Fooling OCR Systems with Adversarial Text Images

Arxiv

3+阅读 · 2018年2月15日

ArcFace: Additive Angular Margin Loss for Deep Face Recognition

Arxiv

6+阅读 · 2018年1月23日

VIP会员

相关主题

相关VIP内容

【KDD2021 】基于协同对比学习的自监督异质图神经网络

专知会员服务

38+阅读 · 2021年5月28日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

[CVPR 2021] 基于傅里叶轮廓嵌入的任意形状文本检测（有源码）

专知会员服务

18+阅读 · 2021年5月8日

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

专知会员服务

35+阅读 · 2021年4月8日

【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习

【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习

专知会员服务

27+阅读 · 2020年12月6日

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

专知会员服务

66+阅读 · 2020年10月20日

【NeurIPS2020】通过最大编码率降低原理学习多样和有判别性的表示

【NeurIPS2020】通过最大编码率降低原理学习多样和有判别性的表示

专知会员服务

15+阅读 · 2020年9月30日

【ICML2020】文本摘要生成模型PEGASUS

【ICML2020】文本摘要生成模型PEGASUS

专知会员服务

35+阅读 · 2020年8月23日

【CVPR2020】跨模态哈希的无监督知识蒸馏

【CVPR2020】跨模态哈希的无监督知识蒸馏

专知会员服务

61+阅读 · 2020年6月25日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【CVPR 2020-人大】层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】层次图推理的细粒度文本视频跨模态检索

专知

7+阅读 · 2020年4月5日

CVPR 2020 | 细粒度文本视频跨模态检索

CVPR 2020 | 细粒度文本视频跨模态检索

AI科技评论

17+阅读 · 2020年3月24日

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

AI科技评论

10+阅读 · 2019年12月23日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

AAAI 2019 | 选择型阅读理解问题上的空间卷积Attention模型

AAAI 2019 | 选择型阅读理解问题上的空间卷积Attention模型

PaperWeekly

5+阅读 · 2019年5月9日

利用神经网络进行序列到序列转换的学习

利用神经网络进行序列到序列转换的学习

AI研习社

12+阅读 · 2019年4月26日

行为识别（action recognition）目前的难点在哪？

行为识别（action recognition）目前的难点在哪？

极市平台

36+阅读 · 2019年2月14日

CVPR 2018 |“寻找”极小人脸

CVPR 2018 |“寻找”极小人脸

极市平台

14+阅读 · 2018年7月11日

CVPR 2018 | 自监督对抗哈希SSAH：当前最佳的跨模态检索框架

CVPR 2018 | 自监督对抗哈希SSAH：当前最佳的跨模态检索框架

机器之心

7+阅读 · 2018年4月14日

大会 | AAAI论文：基于强化学习循环查找受关注区域的多标签图像识别

大会 | AAAI论文：基于强化学习循环查找受关注区域的多标签图像识别

AI科技评论

4+阅读 · 2018年3月14日

相关论文

Multi-Window Data Augmentation Approach for Speech Emotion Recognition

Arxiv

0+阅读 · 2021年6月2日

Attributes-Guided and Pure-Visual Attention Alignment for Few-Shot Recognition

Arxiv

8+阅读 · 2020年12月4日

Equalization Loss for Long-Tailed Object Recognition

Equalization Loss for Long-Tailed Object Recognition

Arxiv

5+阅读 · 2020年4月14日

Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

Arxiv

7+阅读 · 2020年3月19日

Learning Meta Face Recognition in Unseen Domains

Arxiv

5+阅读 · 2020年3月17日

Exploring RNN-Transducer for Chinese Speech Recognition

Arxiv

4+阅读 · 2019年4月23日

Open Set Chinese Character Recognition using Multi-typed Attributes

Open Set Chinese Character Recognition using Multi-typed Attributes

Arxiv

4+阅读 · 2018年8月27日

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Arxiv

4+阅读 · 2018年5月21日

Fooling OCR Systems with Adversarial Text Images

Arxiv

3+阅读 · 2018年2月15日

ArcFace: Additive Angular Margin Loss for Deep Face Recognition

Arxiv

6+阅读 · 2018年1月23日

微信扫码咨询专知VIP会员