图解CNN系列一:卷积神经网络简介

卷积神经网络是深度学习神经网络的一个经典网络,它出现在90年代末,但近年来随着深度学习的发展,CNN在计算机视觉领域获得令人印象深刻的结果。

卷积神经网络与其他神经网络非常相似:它们由具有可以学习的权重和偏差形式的参数的神经元形成。 但CNN的一个差异特征是它们明确假设条目是图像,这允许我们对体系结构中的某些属性进行编码以识别图像中的特定元素。

一、CNN历史背景

CNN的推广主要得益于Yann

LeCun的努力,Yann LeCun现在是Facebook的AI研究主任。

20世纪90年代初,LeCun在当时世界上最负盛名的研究实验室之一的贝尔实验室建立了一个读取并识别手写数字的系统,该系统就是一个典型的端到端图像识别系统。在1998年Leon

Bottou,Patrick Haffner和Yoshua

Bengio三人发表论文介绍了卷积网以及他们建立的完整的端到端系统。在这篇文章的上半部分描述了卷积网络以及具体的实现过程,并提到了与该技术相关的所有其他内容(我将在下面的CNN架构部分介绍)。下半部分展示了如何将卷积网络与语言模型相结合。例如,当您阅读一段英文文本时,您可以在英语语法之上构建一个系统,以提取作为该语言一部分的最可能的解释。最重要的是,您可以构建CNN系统并对其进行训练以同时进行识别和分割,并为语言模型提供正确的输入。

二、CNN基本架构

如下图所示,我们使用图像作为输入。执行一系列卷积+池化操作,然后是一些全连接层。如果我们执行多类分类则输出为softmax。每个CNN有4个基本构建块:卷积层,激活函数,池化层和全连接层。

三、CNN应用

CNN架构继续在计算机视觉领域占据突出地位,其架构优势为下面提到的许多应用和任务提供了速度,准确性和训练方面的改进:

目标检测:CNN是最流行的模型背后的主要架构,例如R-CNN,快速R-CNN,更快的R-CNN。在这些模型中,网络假设对象区域,然后使用这些区域提案中的每一个的顶部CNN对它们进行分类。现在这是许多物体检测模型的主要方法,有自动驾驶汽车、智能视频监控和面部检测等应用方向。

目标跟踪:CNN已广泛用于视觉跟踪应用。例如,鉴于CNN在离线大型图像存储库中进行了预训练,由韩国浦项研究所团队开发的这种在线视觉跟踪算法可以学习判别性图片以便在空间和局部可视化目标。另一个例子是DeepTrack,这是一种在跟踪过程中自动重新学习最有用的特征表示的解决方案,以便精确地调整外观变化,姿势和比例变化,同时防止漂移和跟踪失败。

物体识别:来自法国INRIA和MSR的团队开发了一种弱监督的CNN,不依赖于图像标签,而且可以从包含多个对象的杂乱场景中学习。另一个例子是FV-CNN,一种由牛津人开发的纹理描述符,用于解决纹理识别中的杂乱问题。

语义分割:深度解析网络是由香港的一组研究人员开发的基于CNN的网络,用于将丰富的信息整合到图像分割过程中。另一方面,加州大学伯克利分校的研究人员构建了完全卷积网络,并超越了语义分割领域的最新技术。最近SegNet是一个深度完全卷积神经网络,在语义像素分割的内存和计算时间方面非常有效。

视频和图像字幕:最重要的发明是加州大学伯克利分校的长期周期性卷积网,它结合了CNN和RNN(循环神经网络)来处理大规模的视觉理解任务,包括活动识别,图像字幕和视频描述等。它已经被YouTube的数据科学团队大量部署,以了解每天上传到平台的大量视频。

CNN还在Vision之外发现了许多新颖的应用,特别是自然语言处理和语音识别:

自然语言处理:在机器翻译领域,Facebook的AI研究团队使用CNN来实现最先进的精确度,速度是复发神经系统的9倍。在句子分类领域,纽约大学的Yoon

Kim试验了CNN,这些CNN在预训练的单词向量之上进行了句子级分类任务的训练,并在7项任务中的4项中对最新技术进行了改进。在问答环境中,来自滑铁卢和马里兰州的一些研究人员探讨了CNN在端到端问答中应答选择的有效性。他们发现CNN的答案比以前的算法更好。

语音识别:CNN是用于减少光谱变化和建立声学特征中的光谱相关性以用于自动语音识别的非常有效的模型。结合CNN与隐马尔可夫模型/高斯混合模型的混合语音识别系统已经在各种基准测试中获得了最先进的结果。蒙特利尔大学的研究人员通过将分层CNN与CTC(连接主义时间分类)相结合,提出了一种用于序列标记的端到端语音框架,该框架与现有的基线系统相比具有竞争力。微软的团队使用CNN来降低语音识别性能的错误率,特别是通过构建具有本地连接,权重共享和池化的CNN架构。他们的模型能够对说话者和环境变化保持不变。

总结

卷积神经网络在深度学习的发展中发挥了重要作用。与其他大多数神经网络相比,CNN在深度学习(视觉,语言,语音)的商业应用中表现得非常好。 它们已被许多机器学习从业者用于赢得学术和行业竞赛。 对CNN架构的研究以如此快的速度发展:使用较少的权重/参数,自动学习和推广输入对象的特征,对象位置不变和图像/文本/语音失真等等,毫无疑问CNN是最流行的神经网络技术,而且也是任何想要进入深度学习领域的人必须知道的。

个人微信公众号:python练手项目实战

更多机器学习算法的学习欢迎关注我的个人公众号,里面有更多机器学习与深度学习的文章,希望能和更多学习机器学习的伙伴相互交流和成长。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容