知乎火爆问题:CV和NLP哪个前景更好?

2019 年 12 月 13 日 CVer


相信不少人有这样的疑问,甚至有人说今天AI的行业,CV工程师的含金量已经远远没有NLP工程师高了~ 事实真的是这样的吗?今天就让我们一起来聊聊如何实现计算机视觉的终极目标:让计算机自动理解图片(视频)的内容。

这个终极目标的 核心其实可以拆解为一下几个任务:
1. 让计算机理解图片的场景(咖啡厅, 教室, 博物馆, 等等), 
2. 理解场景中包含的物体(餐具,交通工具,人, 动物等等), 
3. 理解物体所在图片中的位置(bounding box边界框的坐标, 物体的边界点), 
4. 理解物体之间的关系和行为(是在交谈, 体育比赛,对抗, 等等), 以及图片所表达的抽象含义(例如表达讽刺挖苦, 暴力色情, 艺术,宗教的神圣, 大自然的壮阔, 节日的喜庆, 等等)。


如果我们可以让计算机做到这些,那么这个计算机视觉的终极目标就是可以达成的。而这些拆解完成的任务,单独或结合,也都构成了计算机视觉领域,今天在工业界和企业界中的的重要应用点


所以说CV工程师的含金量可以是一点都不低,每一个从事着视觉领域相关工作的工程师可都是各个的十项全能。CV领域不仅技术涉猎宽泛,项目环境复杂多元,更要时时刻刻应对大数据量带来的各种问题与挑战。下面就让我们看看一个合格的视觉算法工程师需要具备怎么样的技能点吧:


贪心学院(国内唯一体系化AI学院)推出的《CV计算机视觉高阶训练营》课程内容围绕计算机视觉的终极目标展开, 通过理论加实践的方式介绍各种类别的计算机视觉任务所需的知识和技术。通过课程的学习, 学员将

深度神经网络处理计算机视觉任务有清晰的理论认知;

具备动手能力解决实际问题;

自己写代码实现经典网络结构解决各种计算机视觉任务;

按照自己的需要定制, 裁剪, 拼装自己的深度网络模型。

01 课程大纲

第一阶段 深度学习基础篇


【核心知识点】
. 逻辑回归与梯度下降法
. 凸函数与凸优化
. BP算法的讲解
. Tensorflow和Keras的使用教程
. GPU配置,安装,训练模型及评估 
. Conv2D,Conv2DTranspos详解
. Dropout, Batch Normalization详解
如何自定义网络层,损失函数
. 深度学习中的调参技术
. 解决过拟合与欠拟合
. 激活函数详解: Sigmoid, Softmax, tanh, softplus, ReLU, hard_sigmoid, linear, exponential, LeakyReLU, PReLU, ELU.
. 优化器详解:GD,SGD,MiniBatch GD,Nesterov,RMSprop,Adagrad,Adadelta,Adam.


第二阶段 多模态模型


【核心知识点】
. 什么是多模态学习?
. VGG16以及基于Pytorch的实现
. 迁移学习详解
. RNN以及BPTT,梯度消失问题
. LSTM, GRU详解
. 注意力机制
. SkipGram
. Elmo, Bert, XLNet
. Beam Search, Greedy Decoding
. BLEU评价指标
. 搭建系统过程中用到的工程技巧

【实战案例】:
. [作业] 利用Pytorch搭建VGG16卷积神经网络
. [作业] 搭建基于注意力机制的LSTM网络
. [项目] 基于Bert的Image Captioning项目实战

第三阶段 物体识别


【核心知识点】

. CNN卷积层工作原理剖析
. 卷积核尺寸,卷积步长,边界填充,输出通道,输出特征图,视场计算
. LeNet-5
. AlexNet
. ZFNet
. GoogleNet/Inception
. VGGNet
. ResNet.
. Fully-Convolutional Network
. DenseNet.
. 图像增 强技术
. 图像增加噪声与降噪
【实战案例】:
[讲解 ] 各类卷积神经网络结构剖析以及实现
. [项目] 不同环境下交通指示牌的识别
. [作业] 定制自己的神经网络


第四阶段 目标检测技术


【核心知识点】

. R-CNN,Fast R-CNN, Faster RCNN
. Region Proposal,Region Proposal Network
. One-Stage物体检测网络模型
. SSD模型
. Anchor的内涵与工作原理
. IoU (Intersection Over Union)
. Hard Negative Mining
. Non-Max Suppression 
. OpenCV Haar小波滤波器
. OpenCV Adaboost
. 图像分割 Dense Prediction
. Unet,Up-Conv
. Transpose Convolution/Deconvolution
【实战案例】:
. [项目] 利用SSD模型完成自动驾驶中的车辆,行人,交通灯的定位
. [讲解] 人脸关键点定位
. [讲解] 图像分割任务

第五阶段 自动驾驶


【核心知识点】

. 自动驾驶技术介绍
. 如何使用多个摄像头
DataGenerator 技术
. 图像的空间域
频率域滤波
图像色彩变换
边缘检测
Hough Transform 用于检测图像中的几何形状物体
【实战案例】:
. [项目] 自动驾驶方向盘转向预测
. [项目] 自动驾驶中行车道的检测

第六阶段 图像生成


【核心知识点】

. GAN 生成对抗网络
. Generator,Discriminator网络结构
. GAN的优化以及实现
. GAN与其他生成模型的比较
. 图像风格化迁移的实现
. Gram Matrix图像风格表达
【实战案例】:
. [讲解] Python编写GAN生成手写数字图像
. [项目] 图像风格迁移:将自拍照转换为毕加索油画

第七阶段 低能耗神经网络


【核心知识点】

. 如何降低神经网络的耗能
. Binarized Neural Network
. MobileNet
. ShuffleNet
. EffNet
. 神经网络的节能原理
. Depth-wise Separable Convolution
. Spatial  Separable Convolution
. Grouped Convolution
. Channel Shuffle
【实战案例】:
. [项目] 二值化神经网络识别交通指示牌
. [项目] 低能耗网络完成自动驾驶方向盘转向预测


第八阶段 新颖网络结果


【核心知识点】

. One-Shot Learning
. Siamese Network 双子网络
. 人脸识别关键技术
. CapsuleNet 胶囊网络
. 胶囊替代神经元旦原理

【实战案例】:
. [实战项目] 双子网络完成人脸识别项目

. [实战项目] 使用胶囊网络进行手写数字的识别和重建


第九阶段 开放式项目


【项目介绍】

课程提供一个机会让学员根据自己的兴趣设计一个计算机视觉的项目. 自己定义问题, 收集训练和测试数据, 设计神经网络模型, 实现代码, 老师在项目中提供指导. 特别适合喜欢挑战自我,善于深入研究的同学。

 

【结果输出】: 
 完整PPT、代码和Conference-Style Technical Report
【评估流程】:
 教学团队Review + 学员Peer-Review
课程设计紧密围绕 学术界最新进展以及工业界的需求,涵盖了所有核心知识点,并且结合了大量实战项目 ,培养学员的动手能力,解决问题能来以及对知识的深入理解。


为AI从业者/研究生/研究员专门定制
全网唯一《CV计算机视觉高阶训练营》

对课程有意向的同学

添加课程顾问小姐姐微信

报名、课程咨询

👇👇👇


02 部分项目展示


课程的亮点不仅仅在于众多深度模型的全面介绍与前沿方法论的实践。我们更强调学员对于技术的全面理解和应用能力。


不是简单的把成熟的深度网络模型实现一遍, 而是按照自己的需求在成熟模型的基础上定制一个属于自己的解决方案,也正式工作中算法师需要的实际能力。


做完我们的项目,  会对算法有更清晰的理解, 会有更强的实践动手能力, 更能够迁移到自己的工作中。每一个项目都是一个挑战,挑战自己学习训练多种符合模型解决项目问题。并在不同模型结果的比较、调整与结合中,找到属于自己的最佳解决方案





03 课程导师

袁源 Jerry

美国微软总部资深AI工程师

亚马逊总部资深AI工程师

美国新泽西理工博士

14年人工智能项目经验。

于国际顶级会议发表15篇以上论文


04 课程特色

  • 内容包含了高级CV算法工程师必备的核心技术体系。

  • 从项目实战出发进行教学,课程具备挑战性和深度,区别于市面上的其他同类的课程。 

  • 理论与实战的结合,理论会从本质层面用通俗易懂的方式讲解,即便很难理解和实操的SSD、BNNs、EffNet、胶囊网络也会让你能够听得懂并且能够理解。每一个重要的知识点会配备实战项目讲解以及核心代码review。

  • 包含具有挑战性的课程项目作业和理论作业,这些会帮助你更深入地理解学过的知识点。

  • 顶尖的导师和助教团队,助教老师均是CV和深度学习领域一线AI企业在职工作者。


    05 课程适合谁?

  • 想从事相关研究工作。

  • 想申请国内外名校的相关专业,去就读硕士、博士的同学。

  • 追求技术细节,不希望仅仅停留在使用工具层面。

  • 已从事AI领域工作,技术上遇到瓶颈,想进一步突破的从业者。

  • 希望在工作中根据业务需求能够提出新的模型,做出创新的同学。

  • 对深度学习领域最新知识体系想有更深入的理解提升。

  • 希望转型到成为一线AI工程师,而非调参、打杂的伙伴。


06 报名要求

  • 掌握Python编程,有良好的编程能力

  • 具备机器学习算法相关基础

  • 了解数据结构与算法的基本知识


07 授课方式

  • 小班化教学,每期仅收50人

  • 全程4个月时间,每周六小时正式课程(直播+录播);

  • 课上不留疑问,课下社群内辅导;

  • 每周固定时间就各难点问题直播进行review session;

  • 作业及项目代码全程 code review

  • 企业级代码管理,使用git进行日常学习、作业代码维护。


本期的训练营在原有的基础上做了大幅度内容的更新,在内容的广度和深度上做了大幅度的调整。可以认为目前的课程体系在全网应该是最全面而且最具有挑战性。如果你想深入去接触这个领域,并且想让自己与时俱进,相信选择我们是正确的选择。 


08 报名须知

1、本课程为收费教学。
2、本期仅招收 50 个名额。
3、品质保障!正式 开课后7天内,无条件全额退款。
4、学习本课程需要具备一定的AI基础。

●●●
为AI从业者/研究生/研究员专门定制
全网唯一《CV计算机视觉高阶训练营》

对课程有意向的同学

添加课程顾问小姐姐微信

报名、课程咨询

👇👇👇


登录查看更多
0

相关内容

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【ICLR2020】图神经网络与图像处理,微分方程,27页ppt
专知会员服务
47+阅读 · 2020年6月6日
NLP基础任务:文本分类近年发展汇总,68页超详细解析
专知会员服务
57+阅读 · 2020年1月3日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
面经 | 算法工程师面试题汇总
极市平台
12+阅读 · 2019年10月14日
为什么所有人都报了这个虐人到哭的NLP训练营?
深度学习与NLP
26+阅读 · 2019年5月15日
深度学习500问!一份火爆GitHub的面试手册
人工智能前沿讲习班
40+阅读 · 2019年3月18日
10个项目给你答案,19年NLP为什么这么骚
PaperWeekly
34+阅读 · 2018年12月29日
深度学习,我们不做“调参工”
计算机视觉life
5+阅读 · 2018年10月16日
如何在NLP领域干成第一件事
AI100
6+阅读 · 2018年2月3日
CNN超参数优化和可视化技巧详解
量子位
4+阅读 · 2017年7月15日
Arxiv
3+阅读 · 2019年10月31日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
12+阅读 · 2019年4月9日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关资讯
面经 | 算法工程师面试题汇总
极市平台
12+阅读 · 2019年10月14日
为什么所有人都报了这个虐人到哭的NLP训练营?
深度学习与NLP
26+阅读 · 2019年5月15日
深度学习500问!一份火爆GitHub的面试手册
人工智能前沿讲习班
40+阅读 · 2019年3月18日
10个项目给你答案,19年NLP为什么这么骚
PaperWeekly
34+阅读 · 2018年12月29日
深度学习,我们不做“调参工”
计算机视觉life
5+阅读 · 2018年10月16日
如何在NLP领域干成第一件事
AI100
6+阅读 · 2018年2月3日
CNN超参数优化和可视化技巧详解
量子位
4+阅读 · 2017年7月15日
相关论文
Top
微信扫码咨询专知VIP会员