普通人CV领域论文创新常见思路与方向总结

2022 年 2 月 5 日 极市平台
↑ 点击 蓝字  关注极市平台

作者 | 何杰文@知乎(已授权) 
来源 | https://zhuanlan.zhihu.com/p/423273070 
编辑 | 极市平台

极市导读

 

本文内容:1. 做CV的论文创新的一些思路与方向。分别是无事生非,后浪推前浪,推陈出新,出奇制胜2. 创新思路形成的学习方法总结。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

一、做CV的论文创新的一些思路与方向

1.无事生非

  1. 在原始的数据集上加一些噪声,例如随机遮挡,或者调整饱和度亮度什么的,主要是根据具体的任务来增加噪声或扰动,不可乱来。如果它的精度下降的厉害,那你的思路就来了,如何在有遮挡或有噪声或其他什么情况下,保证模型的精度。
  2. 用它的模型去尝试一个新场景的数据集,因为它原来的模型很可能是过拟合的。如果在新场景下精度下降的厉害,思路又有了,如何提升模型的泛化能力,实现在新场景下的高精度。

2.后浪推前浪

  1. 思考一下它存在的问题,例如模型太大,推理速度太慢,训练时间太长,收敛速度慢等。一般来说这存在一个问题,其他问题也是连带着的。如果存在以上的问题,你就可以思考如何去提高推理速度,或者在尽可能不降低精度的情况下,大幅度减少参数量或者计算量,或者加快收敛速度。
  2. 考虑一下模型是否太复杂,例如:人工设计的地方太多,后处理太多,需要调参的地方太多。基于这些情况,你可以考虑如何设计一个end-to-end模型,在设计过程中,肯定会出现训练效果不好的情况,这时候需要自己去设计一些新的处理方法,这个方法就是你的创新。

3.推陈出新

替换一些新的结构,引入一些其它方向的技术,例如transformer,特征金字塔技术等。这方面主要是要多关注一些相关技术,前沿技术,各个方向的内容建议多关注一些。

4. 出奇制胜

尝试去做一些特定的检测或者识别。通用的模型往往为了保证泛化能力,检测识别多个类,而导致每个类的识别精度都不会很高。因此你可以考虑只去检测或识别某一个特定的类。以行为识别为例,一些通用的模型可以识别几十个动作,**但你可以专门做跌倒检测。在这种情况下你可以加很多先验知识在模型中,例如多任务学习。换句话来说,你的模型就是专门针对跌倒设计的,因此往往精度可以更高。**这种特定类的检测最好是有些应用前途,让人觉得现实中可以有。

二、创新思路形成的学习方法总结

以上都是一些针对性的思路,最原始的做法应该是看完方向上比较重要的论文后自己写一个综述,写的过程中往往会发现一些问题,不一定就是要去跟sota模型比精度,而是解决这个方向上还存在的问题。解决还存在的问题才是关键,才是论文的核心价值所在,否则就只是十几页的废纸。

例如前面提到的实现轻量化,提高推理速度,实现实时检测,设计end to end模型,都属于解决这个方向上存在的问题,进一步提高精度也是解决问题,此外还包括一些其他的问题,这个得根据具体任务才能分析。

如果说写完综述后还是没思路,一来是建议尝试以上思路,二来建议找一些跟你方向相关的经典论文看一看,边看边想,这四个字最重要。当然,边看边想要想发挥作用,还需要有个最重要的前提,知识面足够广,否则再怎么想也没用

很多情况下在模型上加入一些别的方向的模块,例如使用即插即用的模块、注意力机制等,可以使模型有一定的提升,这是算创新的。但需要一个合理的解释为何这么做可以起作用,解决了什么问题。有时候对原模型做一些小的改进,却有较大的提升,这也属于创新。前提是,这种提升是稳定的,是在多个数据集下都有的提升,而不是一次偶然事件

如果觉得有用,就请分享到朋友圈吧!

△点击卡片关注极市平台,获取 最新CV干货

公众号后台回复“CVPR21检测”获取CVPR2021目标检测论文下载~


极市干货
神经网络: 视觉神经网络模型优秀开源工作:timm库使用方法和最新代码解读
技术综述: 综述:神经网络中 Normalization 的发展历程 CNN轻量化模型及其设计原则综述
算法技巧(trick): 8点PyTorch提速技巧汇总 图像分类算法优化技巧


CV技术社群邀请函 #

△长按添加极市小助手
添加极市小助手微信(ID : cvmart4)

备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)


即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群


每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~



觉得有用麻烦给个在看啦~   
登录查看更多
0

相关内容

「图像异常检测 」最新2022研究综述
专知会员服务
86+阅读 · 2022年4月15日
TPAMI 2022|华为诺亚最新视觉Transformer综述
专知会员服务
55+阅读 · 2022年2月24日
一年一总结的NLP年度进展,2021年有哪些研究热点?
专知会员服务
46+阅读 · 2022年1月27日
专知会员服务
95+阅读 · 2021年5月25日
专知会员服务
47+阅读 · 2020年9月20日
高效医疗图像分析的统一表示
专知会员服务
34+阅读 · 2020年6月23日
基于深度神经网络的少样本学习综述
专知会员服务
171+阅读 · 2020年4月22日
深度学习前人的精度很高了,该如何创新?
极市平台
2+阅读 · 2022年2月5日
盘点我跳过的科研天坑,进坑就是半年白干
极市平台
1+阅读 · 2022年1月7日
计算机视觉中的transformer模型创新思路总结
极市平台
0+阅读 · 2021年12月4日
「我」做算法工作的小反思!
机器学习与推荐算法
0+阅读 · 2021年9月14日
Transformer在CV领域有可能替代CNN吗?
新智元
0+阅读 · 2021年1月9日
一文看懂如何将深度学习应用于视频动作识别
人脸检测与识别总结
计算机视觉战队
21+阅读 · 2017年11月29日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月18日
Detecting Deepfakes with Self-Blended Images
Arxiv
2+阅读 · 2022年4月18日
VIP会员
相关VIP内容
「图像异常检测 」最新2022研究综述
专知会员服务
86+阅读 · 2022年4月15日
TPAMI 2022|华为诺亚最新视觉Transformer综述
专知会员服务
55+阅读 · 2022年2月24日
一年一总结的NLP年度进展,2021年有哪些研究热点?
专知会员服务
46+阅读 · 2022年1月27日
专知会员服务
95+阅读 · 2021年5月25日
专知会员服务
47+阅读 · 2020年9月20日
高效医疗图像分析的统一表示
专知会员服务
34+阅读 · 2020年6月23日
基于深度神经网络的少样本学习综述
专知会员服务
171+阅读 · 2020年4月22日
相关资讯
深度学习前人的精度很高了,该如何创新?
极市平台
2+阅读 · 2022年2月5日
盘点我跳过的科研天坑,进坑就是半年白干
极市平台
1+阅读 · 2022年1月7日
计算机视觉中的transformer模型创新思路总结
极市平台
0+阅读 · 2021年12月4日
「我」做算法工作的小反思!
机器学习与推荐算法
0+阅读 · 2021年9月14日
Transformer在CV领域有可能替代CNN吗?
新智元
0+阅读 · 2021年1月9日
一文看懂如何将深度学习应用于视频动作识别
人脸检测与识别总结
计算机视觉战队
21+阅读 · 2017年11月29日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员