去栅格化的矢量图识别

Recognizing Vector Graphics without Rasterization

论文摘要:本文工作关注在一种与以往大多数工作不同的图像格式:矢量图。和在图像识别中常用的位图不同,由于矢量图基于解析几何的表示方式,可以被无损失的缩放到任意分辨率。同时,矢量图还提供了额外的结构化信息,描述了底层元素是如何构成高层的形状和结构。现有的识别方法并没有充分利用这一格式的优点。本文通过目标检测这一基本的视觉任务来探索这个图像格式。我们提出了一种无需 CNN 的高效网络结构,在识别过程中无需将矢量图渲染为像素图(即栅格化),直接把矢量图的文本作为模型输入,称为 YOLaT (You Only Look at Text)。YOLaT 将矢量图的结构和空间信息建模为一个多重图,并提出一个双流图神经网络基于多重图来进行目标检测。实验证明 YOLaT 通过直接对矢量图进行处理分析,能够在计算效率和性能上显著超过现有的目标检测方法。

https://www.zhuanzhi.ai/paper/8b75d17e2875ed0792f5422150dc1067

成为VIP会员查看完整内容
14

相关内容

【NeurIPS2021】学习用于分布外预测的因果语义表示
专知会员服务
17+阅读 · 2021年11月19日
【NeurIPS2021】多模态虚拟点三维检测
专知会员服务
18+阅读 · 2021年11月16日
【NeurIPS2021】用于视频分割的密集无监督学习
专知会员服务
14+阅读 · 2021年11月14日
【NeurIPS2021】用于物体检测的实例条件知识蒸馏
专知会员服务
19+阅读 · 2021年11月10日
【NeurIPS2021】组合能量概念无监督学习
专知会员服务
13+阅读 · 2021年11月5日
【NeurIPS2021】NeRV:视频的神经表示
专知会员服务
11+阅读 · 2021年10月28日
【NeurIPS2021】未见深度架构参数预测
专知会员服务
9+阅读 · 2021年10月27日
专知会员服务
14+阅读 · 2021年10月18日
专知会员服务
14+阅读 · 2021年10月16日
【CVPR2021】跨模态检索的概率嵌入
专知会员服务
19+阅读 · 2021年3月2日
【CVPR2021】跨模态检索的概率嵌入
专知
16+阅读 · 2021年3月2日
【NeurIPS 2020】核基渐进蒸馏加法器神经网络
专知
13+阅读 · 2020年10月19日
对抗攻击之利用水印生成对抗样本
计算机视觉life
10+阅读 · 2020年9月27日
计算机视觉方向简介 | 室内场景的结构化重建
计算机视觉life
8+阅读 · 2018年11月13日
OCR黑科技,移动报销新玩法
京东大数据
4+阅读 · 2017年11月3日
Arxiv
6+阅读 · 2021年11月12日
Arxiv
11+阅读 · 2018年10月17日
Arxiv
3+阅读 · 2018年8月27日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2018年3月21日
VIP会员
相关VIP内容
【NeurIPS2021】学习用于分布外预测的因果语义表示
专知会员服务
17+阅读 · 2021年11月19日
【NeurIPS2021】多模态虚拟点三维检测
专知会员服务
18+阅读 · 2021年11月16日
【NeurIPS2021】用于视频分割的密集无监督学习
专知会员服务
14+阅读 · 2021年11月14日
【NeurIPS2021】用于物体检测的实例条件知识蒸馏
专知会员服务
19+阅读 · 2021年11月10日
【NeurIPS2021】组合能量概念无监督学习
专知会员服务
13+阅读 · 2021年11月5日
【NeurIPS2021】NeRV:视频的神经表示
专知会员服务
11+阅读 · 2021年10月28日
【NeurIPS2021】未见深度架构参数预测
专知会员服务
9+阅读 · 2021年10月27日
专知会员服务
14+阅读 · 2021年10月18日
专知会员服务
14+阅读 · 2021年10月16日
【CVPR2021】跨模态检索的概率嵌入
专知会员服务
19+阅读 · 2021年3月2日
微信扫码咨询专知VIP会员