本文简要介绍CVPR2021录用论文“Sequence-to-Sequence Contrastive Learning for Text Recognition”的主要工作。该论文提出了一种针对文本识别,序列到序列对比学习的无监督方法SeqCLR。

无监督的对比学习方法在图像分类、目标检测和图像分割[1,2,3,4]中都取得不错的成果。但是无监督和半监督的方法在文本识别中还有待进一步探索。 对于已有的无监督方法SimCLR[1],它将整张图像作为对比学习中的输入元素,这种整图、非序列化的无监督方法从后文的实验中证明对文本识别的效果很差。所以本文提出了一个序列化的无监督方法SeqCLR,它从整张图片中映射出一定数量的实例来作为对比学习中的输入元素。 图片

图1(a)目前的对比方法比较从整个图像中计算出的单个表示。(b)SeqCLR的对比方法比较从整个图像中计算出的多个表示。

本文的方法是第一个提出用于文本识别的自我监督表示学习的工作。通过在特征图中加窗产生正负样本来将文本图片序列化,这种方法在一些手写文本和场景文本数据集中取得不错的效果。

成为VIP会员查看完整内容
28

相关内容

专知会员服务
37+阅读 · 2021年5月28日
专知会员服务
38+阅读 · 2021年5月16日
【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习
近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码
专知会员服务
65+阅读 · 2020年10月20日
【ICML2020】文本摘要生成模型PEGASUS
专知会员服务
34+阅读 · 2020年8月23日
【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
60+阅读 · 2020年6月25日
CVPR 2020 | 细粒度文本视频跨模态检索
AI科技评论
17+阅读 · 2020年3月24日
利用神经网络进行序列到序列转换的学习
AI研习社
12+阅读 · 2019年4月26日
行为识别(action recognition)目前的难点在哪?
极市平台
36+阅读 · 2019年2月14日
CVPR 2018 |“寻找”极小人脸
极市平台
14+阅读 · 2018年7月11日
Equalization Loss for Long-Tailed Object Recognition
Arxiv
5+阅读 · 2020年4月14日
Arxiv
5+阅读 · 2020年3月17日
Arxiv
3+阅读 · 2018年2月15日
VIP会员
相关VIP内容
专知会员服务
37+阅读 · 2021年5月28日
专知会员服务
38+阅读 · 2021年5月16日
【AAAI2021】协同挖掘:用于稀疏注释目标检测的自监督学习
近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码
专知会员服务
65+阅读 · 2020年10月20日
【ICML2020】文本摘要生成模型PEGASUS
专知会员服务
34+阅读 · 2020年8月23日
【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
60+阅读 · 2020年6月25日
微信扫码咨询专知VIP会员