70岁Hinton还在努力推翻自己积累了30年的学术成果，他让我知道了什么叫做生命力 - 专知

会员服务 ·

0

70岁Hinton还在努力推翻自己积累了30年的学术成果，他让我知道了什么叫做生命力

2020 年 11 月 15 日 新智元

新智元报道

来源：算法与数学之美

（ID：MathAndAlgorithm）

【新智元导读】近日，Hinton的那篇Capsule论文终于揭下了神秘的面纱，也因为该篇论文，他被刊进了各大媒体的头版头条。

在论文中，Capsule被Hinton大神定义为这样一组神经元：其活动向量所表示的是特定实体类型的实例化参数。

他的实验表明，鉴别式训练的多层Capsule系统，在MNIST手写数据集上表现出目前最先进的性能，并且在识别高度重叠数字的效果要远好于CNN。

该论文无疑将是今年12月初NIPS大会的重头戏。

不过，对于这篇论文的预热，Hinton大神可是早有准备。

一个月前，在多伦多接受媒体采访时， Hinton大神断然宣称要放弃反向传播，让整个人工智能从头再造。不明就里的媒体们顿时蒙圈不少。

8月份的时候，Hinton大神还用一场“卷积神经网络都有哪些问题？”的演讲来介绍他手中的Capsule研究，他认为“CNN的特征提取层与次抽样层交叉存取，将相同类型的相邻特征检测器的输出汇集到一起”是大有问题的。

当时的演讲中，Hinton大神可没少提CNN之父Yann LeCun的不同观点。毕竟，当前的CNN一味追求识别率，对于图像内容的“理解”帮助有限。

而要进一步推进人工智能，让它能像人脑一样理解图像内容、构建抽象逻辑，仅仅是认出像素的排序肯定是不够的，必须要找到方法来对其中的内容进行良好的表示……这就意味着新的方法和技术。

而当前的深度学习理论，自从Hinton大神在2007年（先以受限玻尔兹曼机进行训练、再用有监督的反向传播算法进行调优）确立起来后，除了神经网络结构上的小修小改，很多进展都集中在梯度流上。

正如知乎大V“SIY.Z”在《浅析Hinton最近提出的Capsule计划》时所举的例子。（https://zhuanlan.zhihu.com/p/29435406）

sigmoid会饱和，造成梯度消失。于是有了ReLU。

ReLU负半轴是死区，造成梯度变0。于是有了LeakyReLU，PReLU。

强调梯度和权值分布的稳定性，由此有了ELU，以及较新的SELU。

太深了，梯度传不下去，于是有了highway。

干脆连highway的参数都不要，直接变残差，于是有了ResNet。

强行稳定参数的均值和方差，于是有了BatchNorm。

在梯度流中增加噪声，于是有了 Dropout。

RNN梯度不稳定，于是加几个通路和门控，于是有了LSTM。

LSTM简化一下，有了GRU。

GAN的JS散度有问题，会导致梯度消失或无效，于是有了WGAN。

WGAN对梯度的clip有问题，于是有了WGAN-GP。

而本质上的变革，特别是针对当前CNN所无力解决的动态视觉内容、三维视觉等难题……进行更为基础的研究，或许真有可能另辟蹊径。

这当然是苦力活，Hinton大神亲自操刀的话，成功了会毁掉自己赖以成名的反向传播算法和深度学习理论，失败了则将重蹈爱因斯坦晚年“宇宙常数”的覆辙。

所以，李飞飞对他在这里的勇气大为赞赏：

如今Capsule的论文刚刚出来，深度学习的各路大神并没有贸然对其下评论，深夜中的外媒亦尚未就此发稿，甚至就连技术圈内一向口水不断的Hacker News，今天也是静悄悄地一片。

不过，可以肯定的一点是，一个月后的NIPS大会，Capsule更进一步的效果必定会有所显现。

至于Hinton此举对于深度学习和整个人工智能界的后续影响，包括Yann LeCun在内的各路大神恐怕都不敢冒下结论，咱们还是静等时间来验证Hinton大神的苦心孤诣到底值不值得吧。

这正如Hinton大神在接受吴恩达采访时所说的：

如果你的直觉很准，那你就应该坚持，最终必能有所成就；反过来你直觉不好，那坚不坚持也就无所谓了。反正你从直觉里也找不到坚持它们的理由。

当然，营长肯定是相信Hinton大神的直觉的，更是期待人工智能能在当前的水平上更进一步。

尽管意义不同，Hinton大神此举却让营长想到了同在古稀之年的开尔文勋爵，他1900年那场关于物理学“两朵乌云”的演讲可是“预言”得贼准：

“紫外灾难”让年近不惑的普朗克为量子力学开创了先河，“以太漂移”让刚刚毕业的爱因斯坦开始思考狭义相对论，经典物理学的大厦就此崩塌。

那么，人工智能上空所飘荡的到底是一朵“乌云”呢？还是一个新的时代？让我们拭目以待。

参考链接：

https://zhuanlan.zhihu.com/p/29435406

登录查看更多

0

相关内容

Hinton

陶大程院士等最新《深度学习理论进展》综述论文，41页pdf255篇文献阐述六大方面进展

专知会员服务

91+阅读 · 2020年12月24日

【经典书】线性代数，352页pdf教你应该这样学

【经典书】线性代数，352页pdf教你应该这样学

专知会员服务

107+阅读 · 2020年12月20日

《人工智能新数学问题: 广义约束》，中科院自动化所胡包钢研究员

《人工智能新数学问题: 广义约束》，中科院自动化所胡包钢研究员

专知会员服务

40+阅读 · 2020年10月27日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

Geoffrey Hinton最新SIGIR2020视频报告：下一代神经网络-无监督对比学习

Geoffrey Hinton最新SIGIR2020视频报告：下一代神经网络-无监督对比学习

专知会员服务

50+阅读 · 2020年7月27日

【经典】论文是怎样炼成的，108页PPT教你研究生毕业通关秘籍

【经典】论文是怎样炼成的，108页PPT教你研究生毕业通关秘籍

专知会员服务

138+阅读 · 2020年3月21日

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

专知会员服务

24+阅读 · 2020年2月22日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

33+阅读 · 2020年2月15日

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

专知会员服务

40+阅读 · 2019年12月5日

【Google大脑Sara Sabour】胶囊架构（Capsule Architectures），附47页ppt

【Google大脑Sara Sabour】胶囊架构（Capsule Architectures），附47页ppt

专知会员服务

39+阅读 · 2019年11月24日

Hinton号召AI革命：重头再来；李飞飞等赞成：深度学习不是唯一

Hinton号召AI革命：重头再来；李飞飞等赞成：深度学习不是唯一

中国人工智能学会

17+阅读 · 2019年6月19日

放弃深度学习，Hinton提出Capsule计划

放弃深度学习，Hinton提出Capsule计划

德先生

3+阅读 · 2018年1月2日

【2017NIPS报告】Hinton高徒 Yee Whye Teh 《贝叶斯深度学习与深度贝叶斯学习》

【2017NIPS报告】Hinton高徒 Yee Whye Teh 《贝叶斯深度学习与深度贝叶斯学习》

专知

11+阅读 · 2017年12月8日

Geffory Hinton的“胶囊”里到底装的什么“药”？

Geffory Hinton的“胶囊”里到底装的什么“药”？

AI前线

4+阅读 · 2017年11月17日

【前沿】Geoffery Hinton 的 NIPS2017 Capsule论文简读

【前沿】Geoffery Hinton 的 NIPS2017 Capsule论文简读

专知

8+阅读 · 2017年10月28日

【重磅】Hinton大神Capsule论文首次公布，深度学习基石CNN或被取代

【重磅】Hinton大神Capsule论文首次公布，深度学习基石CNN或被取代

新智元

9+阅读 · 2017年10月28日

【Capsule】浅析Geoffrey Hinton最近提出的Capsule计划

【Capsule】浅析Geoffrey Hinton最近提出的Capsule计划

GAN生成式对抗网络

7+阅读 · 2017年9月28日

【深度】浅析Geoffrey Hinton最近提出的Capsule计划

【深度】浅析Geoffrey Hinton最近提出的Capsule计划

专知

4+阅读 · 2017年9月25日

浅析Geoffrey Hinton最近提出的Capsule计划

浅析Geoffrey Hinton最近提出的Capsule计划

机器之心

4+阅读 · 2017年9月23日

重磅！Geoffrey Hinton提出capsule 概念，推翻反向传播！

重磅！Geoffrey Hinton提出capsule 概念，推翻反向传播！

人工智能学家

7+阅读 · 2017年9月17日

Downbeat Tracking with Tempo-Invariant Convolutional Neural Networks

Arxiv

0+阅读 · 2021年2月3日

Insiders and Outsiders in Research on Machine Learning and Society

Arxiv

0+阅读 · 2021年2月3日

Adversarial Objects Against LiDAR-Based Autonomous Driving Systems

Adversarial Objects Against LiDAR-Based Autonomous Driving Systems

Arxiv

7+阅读 · 2019年7月11日

Mode Seeking Generative Adversarial Networks for Diverse Image Synthesis

Mode Seeking Generative Adversarial Networks for Diverse Image Synthesis

Arxiv

3+阅读 · 2019年3月18日

Selective Kernel Networks

Arxiv

3+阅读 · 2019年3月15日

Diverse Image-to-Image Translation via Disentangled Representations

Diverse Image-to-Image Translation via Disentangled Representations

Arxiv

13+阅读 · 2018年8月2日

Asynchronous Byzantine Machine Learning (the case of SGD)

Arxiv

3+阅读 · 2018年7月9日

Phrase-Based & Neural Unsupervised Machine Translation

Arxiv

4+阅读 · 2018年4月20日

Handling Homographs in Neural Machine Translation

Arxiv

3+阅读 · 2018年3月28日

Unsupervised Neural Machine Translation

Arxiv

6+阅读 · 2018年2月26日

VIP会员

相关主题

卷积神经网络

相关VIP内容

陶大程院士等最新《深度学习理论进展》综述论文，41页pdf255篇文献阐述六大方面进展

专知会员服务

91+阅读 · 2020年12月24日

【经典书】线性代数，352页pdf教你应该这样学

【经典书】线性代数，352页pdf教你应该这样学

专知会员服务

107+阅读 · 2020年12月20日

《人工智能新数学问题: 广义约束》，中科院自动化所胡包钢研究员

《人工智能新数学问题: 广义约束》，中科院自动化所胡包钢研究员

专知会员服务

40+阅读 · 2020年10月27日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

Geoffrey Hinton最新SIGIR2020视频报告：下一代神经网络-无监督对比学习

Geoffrey Hinton最新SIGIR2020视频报告：下一代神经网络-无监督对比学习

专知会员服务

50+阅读 · 2020年7月27日

【经典】论文是怎样炼成的，108页PPT教你研究生毕业通关秘籍

【经典】论文是怎样炼成的，108页PPT教你研究生毕业通关秘籍

专知会员服务

138+阅读 · 2020年3月21日

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

GeoffreyHinton-ICML2020投稿论文-偏转对抗攻击 Deflecting Adversarial Attacks

专知会员服务

24+阅读 · 2020年2月22日

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

重磅！Geoffrey Hinton新论文「视觉表示对比学习简单框架」自监督学习建立新SOTA-ImageNet准确率76.5%

专知会员服务

33+阅读 · 2020年2月15日

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

专知会员服务

40+阅读 · 2019年12月5日

【Google大脑Sara Sabour】胶囊架构（Capsule Architectures），附47页ppt

【Google大脑Sara Sabour】胶囊架构（Capsule Architectures），附47页ppt

专知会员服务

39+阅读 · 2019年11月24日

热门VIP内容

开通专知VIP会员享更多权益服务

【AAAI2026】Align3GR：面向 LLM 生成式推荐的统一多层次对齐方法

多智能体强化学习中的稳健且高效的通信

【博士论文】通过判别式与生成式学习方法推进 3D场景理解

DeepSeek 实践：大模型部署、微调与应用

相关资讯

Hinton号召AI革命：重头再来；李飞飞等赞成：深度学习不是唯一

Hinton号召AI革命：重头再来；李飞飞等赞成：深度学习不是唯一

中国人工智能学会

17+阅读 · 2019年6月19日

放弃深度学习，Hinton提出Capsule计划

放弃深度学习，Hinton提出Capsule计划

德先生

3+阅读 · 2018年1月2日

【2017NIPS报告】Hinton高徒 Yee Whye Teh 《贝叶斯深度学习与深度贝叶斯学习》

【2017NIPS报告】Hinton高徒 Yee Whye Teh 《贝叶斯深度学习与深度贝叶斯学习》

专知

11+阅读 · 2017年12月8日

Geffory Hinton的“胶囊”里到底装的什么“药”？

Geffory Hinton的“胶囊”里到底装的什么“药”？

AI前线

4+阅读 · 2017年11月17日

【前沿】Geoffery Hinton 的 NIPS2017 Capsule论文简读

【前沿】Geoffery Hinton 的 NIPS2017 Capsule论文简读

专知

8+阅读 · 2017年10月28日

【重磅】Hinton大神Capsule论文首次公布，深度学习基石CNN或被取代

【重磅】Hinton大神Capsule论文首次公布，深度学习基石CNN或被取代

新智元

9+阅读 · 2017年10月28日

【Capsule】浅析Geoffrey Hinton最近提出的Capsule计划

【Capsule】浅析Geoffrey Hinton最近提出的Capsule计划

GAN生成式对抗网络

7+阅读 · 2017年9月28日

【深度】浅析Geoffrey Hinton最近提出的Capsule计划

【深度】浅析Geoffrey Hinton最近提出的Capsule计划

专知

4+阅读 · 2017年9月25日

浅析Geoffrey Hinton最近提出的Capsule计划

浅析Geoffrey Hinton最近提出的Capsule计划

机器之心

4+阅读 · 2017年9月23日

重磅！Geoffrey Hinton提出capsule 概念，推翻反向传播！

重磅！Geoffrey Hinton提出capsule 概念，推翻反向传播！

人工智能学家

7+阅读 · 2017年9月17日

相关论文

Downbeat Tracking with Tempo-Invariant Convolutional Neural Networks

Arxiv

0+阅读 · 2021年2月3日

Insiders and Outsiders in Research on Machine Learning and Society

Arxiv

0+阅读 · 2021年2月3日

Adversarial Objects Against LiDAR-Based Autonomous Driving Systems

Adversarial Objects Against LiDAR-Based Autonomous Driving Systems

Arxiv

7+阅读 · 2019年7月11日

Mode Seeking Generative Adversarial Networks for Diverse Image Synthesis

Mode Seeking Generative Adversarial Networks for Diverse Image Synthesis

Arxiv

3+阅读 · 2019年3月18日

Selective Kernel Networks

Arxiv

3+阅读 · 2019年3月15日

Diverse Image-to-Image Translation via Disentangled Representations

Diverse Image-to-Image Translation via Disentangled Representations

Arxiv

13+阅读 · 2018年8月2日

Asynchronous Byzantine Machine Learning (the case of SGD)

Arxiv

3+阅读 · 2018年7月9日

Phrase-Based & Neural Unsupervised Machine Translation

Arxiv

4+阅读 · 2018年4月20日

Handling Homographs in Neural Machine Translation

Arxiv

3+阅读 · 2018年3月28日

Unsupervised Neural Machine Translation

Arxiv

6+阅读 · 2018年2月26日

大家都在搜

大型语言模型

国防科技创新

朱克爱德华兹家族

精排模型-从MLP到行为序列：DIN、DIEN、MIMN、SIM、DSIN

微信扫码咨询专知VIP会员