实验室只有我一个人做视觉slam,现在就改改orbslam2,请问有什么建议吗?

2020 年 6 月 16 日 计算机视觉life

点击上方“计算机视觉life”,选择“星标”

快速获得最新干货


本文由计算机视觉life整理,如有侵权可联系删除。原文链接:

https://www.zhihu.com/question/392988118

原提问:

昨年9月开始入坑,自学了ROS,Ubuntu,c++。理论上学习了高翔博士的slam14讲(第一遍没跟着敲,编程能力太弱,现在在看第二遍,把理论推导了一遍,代码也跟着在敲),跑了跑orb-slam2(单目相机,tum数据集),想找创新点,一直在看别人的论文。

这几天又在了解dso,和svo。

后期准备学习VIO。

还比较喜欢这个方向,想以后工作也可以继续做这个方向。
间歇性迷茫。
希望大神们能给我一些指导!感谢!


半闲居士:

这其实只是没找到具体研究点,找个点往下挖就可以了。至于研究点找的偏理论些还是偏实际些,看你个人兴趣了。

在TUM的时候,一般硕士生会由博士来带,博士指定一个课题方向。和slam相关方向实际就是dso的各种改动:双目的,鱼眼的,带IMU的,带卷帘快门的,还有一些单目深度估计,分布式Ba之类的方向。确定下来之后做个一年基本就可以写paper了,当然没有深度学习那么快,不过也够毕业的。其他几个实验室也基本会从实验室的一些已有成果出发,做一些改进和探索。你看vins, okvis, dso, event camera, gtsam那几个组,文章哪有单独冒出一篇来的,都是一串一串发的。

所以一个人做研究的主要问题是:一,没人给你指研究方向;二,没人跟你聊进度和想法。只要有上面两点,其他数学上的编程上的事情都好解决。其实最好的办法是去几个国际大组里交换一阵子,没条件的话可以云交换(在网上follow人家思路),或者去工业界了解下slam需求。脸皮厚点的话可以直接给他们发邮件交流想法,不过部分人不一定有这个工夫。

知乎用户:

如果你并非天赋超绝,我建议是放弃!

我跟你情况一模一样,我的课题稍微难一些是用在水下的slam,实验室也是只有我在做slam,老师和周围同学都不懂。

slam是一个系统,而不是一种方法,对于一种方法上的创新是相对比较简单的,对于系统上的创新在没有人引导的情况下是极难的。在我的学习中我认为最简单的内容就是图像匹配的几种方法、pnp、字典模型,进入了后端每一个小问题都很恶心,尤其是涉及图优化、李群李代数、凸优化这部分内容,在没有人讨论、共同学习的情况下是及其痛苦的。(ps:我说的都是理论,应用都不算很难)

slam整体对于数学、编程能力要求都是极高的,如果你没有极其优秀的数学基础,优秀的编程能力建议早早放弃。

但不得不说slam找工作好找,只要你能够有所进展(不需要是小神),研究生年薪30w起步。

思路上最容易想到的是多传感器融合,松紧耦合,提高定位准确率;或者是在回环检测中更换深度学习的方式

然后是应用上的创新,在某些特殊场合下使用的slam,

相对难搞的点是某个环节的创新,提高准确度,或者降低运算代价

最难的是体系的创新

知乎用户:

我两年前和你的状态一样… 我们实验室有近60人,都在做ML,只有我一个人做SLAM,像个怪胎一样。迷茫,孤独,无助。有一年多。没人讨论,没人指导,这些我都经历过。想去大组实习抱大腿,但没人脉没文章人家凭什么收你?

之后调整了状态,既然只能单干就静下心来做吧。入山拜佛,得先过自己。现在终于入了点门,中了一篇CVPR, 一篇ICRA。心得就是想发论文的话,做deep-learning和SLAM结合的方向。找个开源的代码,最好是中了顶会后刚刚开源的那种。先做做incremental的research,实现一些小的improvement发一篇。之后就知道怎么做了。

马丁当:

我的情况和你l有点类似,不过我没有科研压力,相对轻松一些。我的建议如下:

1.200块上淘宝买个乐视RGBD摄像头,自己采集一些数据集,自己标定并且建一些实验室、宿舍的地图,这样能让科研变得更有乐趣,钱多一点的话买个带IMU硬件同步的D435i或者其他双目,这样可以搞vins。z在这个领域,离开硬件的支持只搞软件只会让你感到无趣。

2.按照沈劭杰老师的说法,定位这块理论上的突破点已经很少,下一步是如何应用到工程领域,而且苹果、谷歌这样的巨头已经进来,可以摘的桃子已经很少,如果题主数学基础很好的话另说。但是建图,尤其实时稠密建图方面还有空间可以发挥,题主hk可以g关注y一下

3.自己做确实会比较迷茫,还是和导师做好沟通,利用导师资源寻找一些出去交流或者请人过来的机会。起步阶段利用网上资源,加入一些社群,比如泡泡机器人什么的。

4.c++编程能力是一切的基础,把c++ primer多看几遍非常有必要,另外就是多qx写代码,自己把slam十四讲上的东西都实现一遍,会很有帮助。

知乎用户:

实验室里,你是一个人,但实际是,你永远都不是一个人!

周边没人做给你带来更多交流成本,但也同时在锻炼你探索和交流的能力。

slam永远是前端多trick,后端多理论。如果想发文章,找一个需要很多trick才能做好的点,然后多学trick,再多想trick,trick融合啊,对比啊,改变下处理顺序啊,实现同样的功能是不是可以有其他trick啊。如果对slam细化不是很清楚,可以参考一下苏黎世联邦理工的aslam_cv,人家把模块分的很清楚,挑一个模块改进啊。

缺乏交流和基础,或者时间有限,不要轻易把研究点放在闭环检测和后端优化上。但一定要静下心来学好优化,不求突破,但求会看会模仿着写。

如果是为了论文,有一些点大家在玩感觉还是可以玩的,比如,考虑动态场景中slam某模块的算法鲁棒,深度学习替换某个slam模块,多传感器融合。

c++之路注定杂草丛生,荆棘遍布,没有什么胜利可言,挺住意味着一切

盐粒:

其实,大家做SLAM都是一个人做,这不是问题,问题是对最新研究进展的把握。诚如高博所说,文章都是一串的,ORBSLAM2是非常好的学习材料,但是你现在没办法接在他后面了,因为时间有点久了,点线/闭环/稠密都有人做过了, 你要找到那最新的一串,然后接在后面。

1.产生想法。你要关注ICRA,IROS,CVPR,ICCV, RAL, T-RO最新的文章,从这些文章了找到你感兴趣,并能力范围的课题. 文章就像是武林秘籍,所有招式都在那里。

2.调研这个想法。多读读与它相关的文章,多找找代码。

3.边实验边丰富/调整。所有想法都是落实到代码,慢慢写,慢慢丰富你的想法,或者做必要的修改。

方法论的东西,只能泛泛而谈,没办法告诉你做什么,能发论文。但是,你读了基于特征的SLAM,很多相关的内容都可以做了,vSLAM稠密不是事,闭环也有LDSO。那VIO呢?能不能为它做稠密/闭环?我不知道,但是很多灵感都是来自不断跨界。祝你找到适合你的那一串。

从0到1学习SLAM,戳↓

一文概览视觉SLAM详细学习路线、思维脑图

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


投稿、合作也欢迎联系:simiter@126.com

长按关注计算机视觉life


我在坚持  

登录查看更多
15

相关内容

即时定位与地图构建(SLAM或Simultaneouslocalizationandmapping)是这样一种技术:使得机器人和自动驾驶汽车等设备能在未知环境(没有先验知识的前提下)建立地图,或者在已知环境(已给出该地图的先验知识)中能更新地图,并保证这些设备能在同时追踪它们的当前位置。
专知会员服务
44+阅读 · 2020年7月15日
【开放书】SLAM 中的几何与学习方法,62页pdf
专知会员服务
111+阅读 · 2020年6月5日
基于视觉的三维重建关键技术研究综述
专知会员服务
164+阅读 · 2020年5月1日
 第八届中国科技大学《计算机图形学》暑期课程课件
专知会员服务
59+阅读 · 2020年3月4日
【干货51页PPT】深度学习理论理解探索
专知会员服务
63+阅读 · 2019年12月24日
专知会员服务
87+阅读 · 2019年12月13日
如何系统学习视觉惯性里程计(VIO)?
计算机视觉life
17+阅读 · 2019年5月12日
如何从零开始系统化学习视觉SLAM?
计算机视觉life
21+阅读 · 2019年4月13日
2018年SLAM、三维视觉方向求职经验分享
计算机视觉life
17+阅读 · 2019年2月25日
SLAM领域牛人、牛实验室、牛研究成果梳理
计算机视觉life
12+阅读 · 2018年12月6日
从零开始一起学习SLAM | SLAM有什么用?
计算机视觉life
18+阅读 · 2018年9月17日
从零开始一起学习SLAM | 学习SLAM到底需要学什么?
计算机视觉life
8+阅读 · 2018年9月9日
牛逼哄哄的SLAM技术即将颠覆哪些领域
算法与数学之美
5+阅读 · 2017年11月15日
推荐|视觉SLAM漫淡:机器人即时定位与地图构建!
全球人工智能
8+阅读 · 2017年9月30日
SLAM初识
计算机视觉life
5+阅读 · 2017年6月4日
Real-time Scalable Dense Surfel Mapping
Arxiv
5+阅读 · 2019年9月10日
Arxiv
3+阅读 · 2019年3月1日
Structure Aware SLAM using Quadrics and Planes
Arxiv
4+阅读 · 2018年8月13日
Arxiv
4+阅读 · 2018年6月14日
VIP会员
相关VIP内容
专知会员服务
44+阅读 · 2020年7月15日
【开放书】SLAM 中的几何与学习方法,62页pdf
专知会员服务
111+阅读 · 2020年6月5日
基于视觉的三维重建关键技术研究综述
专知会员服务
164+阅读 · 2020年5月1日
 第八届中国科技大学《计算机图形学》暑期课程课件
专知会员服务
59+阅读 · 2020年3月4日
【干货51页PPT】深度学习理论理解探索
专知会员服务
63+阅读 · 2019年12月24日
专知会员服务
87+阅读 · 2019年12月13日
相关资讯
如何系统学习视觉惯性里程计(VIO)?
计算机视觉life
17+阅读 · 2019年5月12日
如何从零开始系统化学习视觉SLAM?
计算机视觉life
21+阅读 · 2019年4月13日
2018年SLAM、三维视觉方向求职经验分享
计算机视觉life
17+阅读 · 2019年2月25日
SLAM领域牛人、牛实验室、牛研究成果梳理
计算机视觉life
12+阅读 · 2018年12月6日
从零开始一起学习SLAM | SLAM有什么用?
计算机视觉life
18+阅读 · 2018年9月17日
从零开始一起学习SLAM | 学习SLAM到底需要学什么?
计算机视觉life
8+阅读 · 2018年9月9日
牛逼哄哄的SLAM技术即将颠覆哪些领域
算法与数学之美
5+阅读 · 2017年11月15日
推荐|视觉SLAM漫淡:机器人即时定位与地图构建!
全球人工智能
8+阅读 · 2017年9月30日
SLAM初识
计算机视觉life
5+阅读 · 2017年6月4日
Top
微信扫码咨询专知VIP会员