CVPR 2022|群核前沿院等提出首个基于数据驱动的面检测算法

2022 年 3 月 15 日 极市平台
↑ 点击 蓝字  关注极市平台

作者丨叫我佳老师@知乎(已授权)
来源丨https://www.zhihu.com/question/517340666/answer/2374684918
编辑丨极市平台

极市导读

 

本文从数据驱动的角度重新审视从线框图中检测面这一经典问题,将其建模为序列生成问题:从任意一条开始,采用流行的基于Transformer的模型,以自然顺序预测属于同一个面的其他边。 >>加入极市CV技术交流群,走在计算机视觉的最前沿


项目链接:https://manycore-research.github.io/faceformer/

论文链接:https://arxiv.org/abs/2203.04229

代码链接:https://github.com/manycore-research/faceformer

肝完了ECCV 2022,来介绍一下我们刚被CVPR 2022接受的基于单张线框图的三维重建论文。

太长不看(TL;DR)

我们提出了首个基于数据驱动的面检测算法;我们基于面检测结果提出了一个简易的三维重建解决方案。

前言

面检测是计算机视觉/图形学中的一个基本问题。传统方法基于复杂的几何搜索与推断,很不直观。然而,人眼可以迅速地从图片中找出此类几何元素,因此我们猜想:人脑的判定方式是基于历史观测数据。因此提出通过数据驱动的方法,训练神经网络在进行此类检测。

基于自回归模型的面检测

面检测就是从输入的单张线框图(矢量图)中找到真实三维面所对应边的集合,如下图所示。

面检测

边界表达(B-Rep)是CAD中标准模型表达的方式,我们的方法借鉴了其中共边(co-edge)这一个属性:

  1. 每个边(edge)对应了两个共边(co-edge),且两个共边方向相反;

  2. 每条边(edge)严格被两个面(face)共享,这条边的两个共边分别对应了这两个面;

  3. 共边(co-edge)方向定义:沿环的方向看,(假设面的方向朝上)面总在边的左侧。

边界表达(B-Rep)

借助共边, 面就可以方便被表达为共边的环 (co-edge loops) , 如上图所示, 三个标记的面的共 边的集合分贝是

随后,我们设计了一种基于Transformer的自回归模型,从每条共边出发,网络自动的寻找其所在的面。如下图所示,网络每次基于当前预测的共边集合,输出下一条边,当预测结束后,预测出对应面的类型。

Faceformer示意图

这样做的好处是,我们的模型可以在共边这个维度上做到并行,加速网络的推断。我们惊讶的方法,基于自回归的方法能够达到93.8%的准确率和95.9%的精度(如果训练更久,达到99%也不在话下)。

三维重建

随后,我们基于面检测的结果设计了一个三维重建算法。大致的思想是利用面检测中得到的平面,三维重建提供了一组共面的约束。但是,只依赖面检测的结果是不够的,我们假设物体有三个相互垂直的主方向(曼哈顿假设),进一步约束面的朝向(具体算法参见论文吧,在此就不赘述了)。

再来看看我们三维重建的结果吧,与单纯基于图像的三维重建算法相比,我们的方法不仅重建地更好,而且还能保证拓扑的正确性。比较amazing的是最后一行的结果,相信小伙伴们单单通过输入图片也很难想象出这个三维物体的形状吧。

三位重建结果对比


公众号后台回复“数据集”获取60+深度学习数据集下载~

△点击卡片关注极市平台,获取 最新CV干货
极市干货
数据集资源汇总: 10个开源工业检测数据集汇总 21个深度学习开源数据集分类汇总
算法trick 目标检测比赛中的tricks集锦 从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks
技术综述: 一文弄懂各种loss function 工业图像异常检测最新研究总结(2019-2020)


CV技术社群邀请函 #

△长按添加极市小助手
添加极市小助手微信(ID : cvmart4)

备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)


即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群


每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~


觉得有用麻烦给个在看啦~   
登录查看更多
0

相关内容

CVPR 2022 Oral | 基于熵筛选的半监督三维旋转回归
专知会员服务
17+阅读 · 2022年4月18日
【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准
专知会员服务
35+阅读 · 2022年4月2日
CVPR2022 | 多模态Transformer用于视频分割效果惊艳
专知会员服务
40+阅读 · 2022年3月12日
【NeurIPS2021】多模态虚拟点三维检测
专知会员服务
18+阅读 · 2021年11月16日
【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
21+阅读 · 2021年4月20日
【CVPR2021】面向视频动作分割的高效网络结构搜索
专知会员服务
13+阅读 · 2021年3月14日
专知会员服务
21+阅读 · 2021年3月9日
【CVPR2021】细粒度多标签分类
专知会员服务
60+阅读 · 2021年3月8日
最全综述:基于深度学习的三维重建算法
极市平台
12+阅读 · 2020年3月17日
CVPR 2018 论文解读 | 基于GAN和CNN的图像盲去噪
PaperWeekly
13+阅读 · 2019年1月22日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
1+阅读 · 2022年4月19日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Arxiv
26+阅读 · 2018年9月21日
VIP会员
相关VIP内容
CVPR 2022 Oral | 基于熵筛选的半监督三维旋转回归
专知会员服务
17+阅读 · 2022年4月18日
【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准
专知会员服务
35+阅读 · 2022年4月2日
CVPR2022 | 多模态Transformer用于视频分割效果惊艳
专知会员服务
40+阅读 · 2022年3月12日
【NeurIPS2021】多模态虚拟点三维检测
专知会员服务
18+阅读 · 2021年11月16日
【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
21+阅读 · 2021年4月20日
【CVPR2021】面向视频动作分割的高效网络结构搜索
专知会员服务
13+阅读 · 2021年3月14日
专知会员服务
21+阅读 · 2021年3月9日
【CVPR2021】细粒度多标签分类
专知会员服务
60+阅读 · 2021年3月8日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员