现在投身于计算机视觉是否明智?

2019 年 8 月 23 日 CVer

点击上方“CVer”,选择加"星标"或“置顶”

重磅干货,第一时间送达

编辑:Amusi

https://www.zhihu.com/question/317440183

本文仅作为学术分享,如果侵权,会删文处理


现在投身于计算机视觉是否明智?


周围很多大佬都去深造或者工作做CV相关方向。然而看到一种言论,说现在学CV无异于48年加入国民党,求问此话怎讲。

PS 本人本科毕业正要工作,有图像处理算法岗位offer。水平很菜,对计算机视觉方向很有兴趣(也许是跟风,且自动驾驶等等领域的确很容易让人产生兴趣)。

假设侥幸拿到CV相关offer(或者machine learning/deep learning岗位)那么是否应该果断加入。(因为图像处理算法可能相对传统一些)


作者:匿名用户
https://www.zhihu.com/question/317440183/answer/683203621

有多少人工就有多少AI,我相信各位真正的从业者是最清楚这点不过的,论文满分的模型现实情况下基本没法直接跑模型了事,必需跟随大量的数据和集成工作。目前AI饱和主要在于产业市场还没有起来,但是一旦其需求大起来,对应的人才要求也会变多。至于未来市场怎样,就不是我等工程师能预测的了。但按照《人类简史》中的说法,现代社会经济建立于对未来的信用上,现代经济要继续发展,必须有新的技术可以推动生产,至于这个技术是物联网,5G,AI,AR,基因工程中的一个还是多个,也不好说



以下是原答案


有一段时间在一家创业公司做CV,当时碰壁很多,人脸市场由巨头把持,基本不太可能与其竞争,我们当时打算做遥感AI,农业AI,后来发现处于数据精度问题,基本无法落地,后来整个组不得不转型做大数据外包。当时我的想法是,CV真的是泡沫。


后来到了国内某设备商做算法,发现CV可以用的地方不要太多了,降噪,定位,超分……CV从来不是单单指人脸这一块,哪一块都可以做,而它们又有相通之处,可以入的方向还是很多的。


之前和某些明星公司也有接触,可以说,实在的落地效果和竞赛榜单有天囊之别,在榜上刷的接近完美的指标,落地下来不足50%也是常有的事情,外界环境稍微差一点,算法效果非常恐怖,更别说性能……实际上算法领域如何在工程界落地,还有很长的路要走。实际调优的过程,的确和经验积累有关。有的时候因为算法流程的设计,有经验的工程师能够很快发现哪个流程有问题需要改进,这些慕课上是不会告诉你的。个人认为,CV本质上考察的是对系统的了解程度,对数据的了解程度,从来不是某个特定的算法。


如果能做到对系统了然于心,对性能优化(这也是必须根据设备考虑的问题)有深入了解,这样的人才是真的很缺。



作者:CPAPCF
www.zhihu.com/question/317440183/answer/794570674

说48年加入国民党只因把cv限制在了2D分类/检测/跟踪任务里。这些传统任务确实早在16年甚至更早就接近problem solved,任务明确数据标准方法成熟。现在刷榜也只有微小提升。画地为牢当然没搞。


且不说什么concept extraction/self-awareness/vision+language那套纯炼丹的玄学意识流,vision的共同问题是什么?是从图像分析信息,那能从图像里分析光照/材质/光源位置性质吗?能从图像里分析物理系统做受力分析判断受力点支撑面吗?能从图像分析物体运动状态吗?能从图像分析物体内部结构预测应力形变吗?


再从方法来说,纯炼丹就一定最好吗?vision传统的geometry理论和物理基础规则为什么要弃之不顾拿去让炼丹从头approximate?


然后从输入的角度看,双目做过吗?多目会有提升吗?单目能做吗(btw, 单目+纯炼丹是邪路)?别的sensor呢?比如MRI扫描信号?电子显微镜扫描信号?雷达?雷达阵列?声纳?


我只是举了一些非常片面的例子,但哪怕把上面这些暴力排列组合一下这都多少可能性了?


宏观来说,vision在工业上的应用绝不会停止也从没有停止。举个例子,我们今天能在超市里买到的整齐又便宜的红苹果和盒装鸡蛋,哪怕薯片,更不用说pcb和芯片制造,都是靠70-80年代开发的vision系统,才得以实现大规模流水线生产,然后降低成本和普及。vision内部流派可能会起起伏伏,跟不上市场需求的会很快暴死。但只要有外部市场demand,只要有资本家拿钱提出问题,就总有人能为钱做出解决方法,vision就绝不可能停止发展。ps,炼丹可能会死但vision绝不会死 :)



作者:Encoder
https://www.zhihu.com/question/317440183/answer/684387715

视觉是人类最重要的感觉,人类认识外界信息的80%来自视觉,视觉的认知机制也最复杂。因此,计算机视觉(computer vision),也就是利用各种成像系统代替人类的视觉器官作为输入手段,通过分析图像生成关于成像物体和场景的描述,使得计算机像人那样观察和理解世界,以具有自主适应环境的能力,始终是人工智能的一个重要组成部分。


计算机视觉已经走过了半个世纪的风风雨雨,从借用信号处理的概念、将图象视作“二维信号”而进行分析,到逐步发展出一套包含预处理、特征提取、目标追踪、三维重建等等方向在内的完整的领域,再到机器学习、深度学习方法的广泛运用,可以说,无论是过去、现在还是未来,计算机视觉领域都有大量的工作可以做,有大量的难题需要突破,也有大量的激动人心的宝藏、尚待我们去发掘。刷脸支付、无人驾驶、无人机航拍、手术机器人等等我们耳熟能详的应用,都与计算机视觉息息相关。



计算机视觉发展史


Faster R-CNN 用于目标检测,see https://arxiv.org/pdf/1506.01497.pdf


是否投身于计算机视觉的科研和工作,当然首先有赖于自己的兴趣。另一方面,“全民AI”“全民CS”甚至“全民CV”的确是造成了计算机视觉方向人才供过于求的情形,大量的学生和从业者的涌入,很有可能会造成内卷的情况;人才饱和、甚至所谓的“泡沫破灭”也并不是不会发生。然而从普遍意义上说,在人工智能时代的浪潮中,作为计算机相关专业的学生,无论是选择继续科研还是进入工业界,计算机视觉都仍然是一个既有广泛的应用前景(钱景),又容易激发兴趣、引人入胜的方向。


题主的担心其实也有道理,因为,尽管智能化这个大的趋势是不会变的,但是在这个大趋势的过程中,起伏依然是不可预知的,甚至也是不可避免的。经济学告诉我们,过度扩张就会带来收缩,过热就可能在未来遇冷,这是行业本身调节的结果,也是行业健康发展的保证。越是站在浪潮之巅,越要保持冷静清醒。作为CV领域的研究者和从业者,我们要准备好应对未来几年可能出现的转冷局面,应对可能出现的CV行业人才饱和、就业困难的窘境。我想主要的还是要做好以下几点。


第一,传统算法不可偏废。


举几个例子:

  • 尽管基于深度学习的特征提取方法取得了很大的成功,但传统的特征提取算法,例如Harris角点,SIFT, SURF等等,仍是需要认真学习的。

  • 图像预处理的方法,包括图像的滤波、分裂、归并、分割以及形态学处理等等,也可以与深度学习方法相结合,例如dilated CNN就可以看做形态学操作与CNN的结合。

  • SVM, KNN等等经典的机器学习算法在CV中的应用也不可忽视。

传统的计算机视觉和机器学习算法依然在很多场景下有用武之地,这些算法不仅在工程上有稳健的性能,而且相比于深度学习算法,在数学上也有更清晰的解释。因此,深入理解这些经典算法的思想,对于我们改进既有算法和提出新算法,也是很有启发性的。


第二,重视数学、重视编程。


我们需要有一批不满足于import cv2, import torch, import torchvision,不满足于机械调参,不满足于堆砌网络结构的研究者,能够提出一套严密的指导性的理论,改善目前深度学习中以试凑调参为主来达到目标的训练方式。我们需要思考能否在底层实现上做出改进或提出新的算法,而非简单地将既有算法排列组合。在数学和编程方面的积累,尽管需要下苦功夫,也不一定能够立竿见影,但是最终一定会惠及你未来的发展,无论在科研还是工作上,都能让你行稳致远。


第三、推动CV真正落地。


许多行业都积累了大量的图像信息,需要借由计算机来辅助甚至部分代替人脑对图像进行处理和解释,都有用计算机代替人去“看”的刚需。从图像预处理、图像特征提取及分割,到物体的几何模型与图像特性表达,再到对物体和周围环境的理解,都有广泛的应用场景。我们要避免空对空的灌水,要让CV更好地从实验室走入千家万户,真正应用于实际的生产生活的场景之中,真正拉动经济社会各个部门、各个方面的发展,真正成为我们每个人生活中不可或缺的一部分。


总之,投身于计算机视觉不失为明智之选,面对竞争的关键不在于踯躅犹疑,而在于增强自身的竞争力。计算机视觉的舞台足够广阔,将计算机视觉的理论与应用相对接、算法与工程相融合、精确与快速相平衡、简洁与清晰相印证、优美与实用相增益,始终激励着一批又一批有热情、有韧劲、有定力、有决心、有才华的研究者,扎扎实实地做出成果,特别是让计算机视觉更好地与各行各业相结合,真正助力经济社会发展,也使得我们的生活更加便捷。



作者:JohnMason
https://www.zhihu.com/question/317440183/answer/688971077

不邀自来。


计算机视觉方面的现状:工程师很多,研究人才稀缺

这可能是现在计算机方面的整体情况,大部分领域都是这样,研究人才稀缺。

那么造成这种情况的原因是因为:


1、相对其他行业来讲资薪较高。

2、热度高,人气盛。

3、入门相对其他方面来讲较容易。

如果拿到CV相关的offer,可以考虑按照这样的方式来:

1、学习有关类的编程(python、Cpp)。

2、大概有一定的基础后可以开始考虑框架(TensorFlow、Keras、Caffe、PyTroch等),具体的框架可以自己进行比较。

3、学习关于《机器学习》、《深度学习》的知识。

4、可以尝试做一些简单的项目。

5、确定方向,阅读该方面的论文,实现该论文的网络结构。


但是,入门相对来说比较简单,而且工程师的人才过剩。缺少的是相关的研究人才。如果想要进入研究方面,需要一定的数学知识和逻辑基础。在数学和逻辑之上要多阅读论文,讲最新论文中的结构复现,理解其中的原理。


重磅!CVer学术交流群成立啦


扫码添加CVer助手,可申请加入CVer-目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测和模型剪枝&压缩等群。一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡)

▲长按加群


▲长按关注我们

麻烦给我一个在看

登录查看更多
0

相关内容

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
129+阅读 · 2020年7月10日
专知会员服务
123+阅读 · 2020年3月26日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
80+阅读 · 2020年3月4日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
87+阅读 · 2019年10月21日
AI算法工程师需要哪些核心竞争力
AINLP
7+阅读 · 2019年6月23日
入行量化,你必须知道的几点
深度学习与NLP
12+阅读 · 2019年3月5日
Java 工程师快速入门深度学习,可以从 Deeplearning4j 开始
人工智能头条
13+阅读 · 2018年12月14日
五大维度深入分析计算机视觉
专知
9+阅读 · 2018年12月6日
无人再谈CV:计算机视觉公司的困境
镁客网
7+阅读 · 2018年7月7日
总理4次@人工智能,AI工程师薪酬究竟如何?
人工智能头条
3+阅读 · 2018年3月21日
零基础小白,如何入门计算机视觉?
计算机视觉life
9+阅读 · 2018年3月8日
2018年,AI工程师校招薪酬出炉!
数据玩家
6+阅读 · 2018年2月28日
在成为新晋网红之后,AI却寒冬将至
拓扑社
15+阅读 · 2017年12月20日
Anomalous Instance Detection in Deep Learning: A Survey
Arxiv
4+阅读 · 2019年4月17日
Arxiv
11+阅读 · 2018年7月31日
Arxiv
22+阅读 · 2018年2月14日
Arxiv
3+阅读 · 2017年11月20日
VIP会员
相关VIP内容
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
129+阅读 · 2020年7月10日
专知会员服务
123+阅读 · 2020年3月26日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
80+阅读 · 2020年3月4日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
87+阅读 · 2019年10月21日
相关资讯
AI算法工程师需要哪些核心竞争力
AINLP
7+阅读 · 2019年6月23日
入行量化,你必须知道的几点
深度学习与NLP
12+阅读 · 2019年3月5日
Java 工程师快速入门深度学习,可以从 Deeplearning4j 开始
人工智能头条
13+阅读 · 2018年12月14日
五大维度深入分析计算机视觉
专知
9+阅读 · 2018年12月6日
无人再谈CV:计算机视觉公司的困境
镁客网
7+阅读 · 2018年7月7日
总理4次@人工智能,AI工程师薪酬究竟如何?
人工智能头条
3+阅读 · 2018年3月21日
零基础小白,如何入门计算机视觉?
计算机视觉life
9+阅读 · 2018年3月8日
2018年,AI工程师校招薪酬出炉!
数据玩家
6+阅读 · 2018年2月28日
在成为新晋网红之后,AI却寒冬将至
拓扑社
15+阅读 · 2017年12月20日
Top
微信扫码咨询专知VIP会员