在这次演讲中,我们从数据压缩(和群不变性)的角度提供了对深度(卷积)网络的完全“白盒”解释。特别地,我们展示了现代的深层架构、线性(卷积)算子和非线性激活,甚至所有的参数都可以从最大化速率缩减(具有群不变性)的原则推导出来。网络的所有层、操作符和参数都是通过前向传播明确构建的,而不是通过后向传播学习。因此得到的网络的所有组件称为ReduNet,具有精确优化、几何和统计解释。这种原则性的方法也有一些令人惊讶的地方:它揭示了类可分离性的不变性和稀疏性之间的基本权衡;它揭示了深层网络和群体不变性的傅里叶变换之间的基本联系-频谱域的计算优势(为什么是尖突神经元?);这种方法还阐明了正向传播(优化)和反向传播(变异)的数学作用。特别地,这样获得的ReduNet 可以通过前向和后向(随机)传播进行微调,都是为了优化同一目标。这是与Berkeley的Yaodong Yu, Ryan Chan, Haozhi Qi ,现在谷歌研究中心的You Chong博士,以及哥伦比亚大学的John Wright教授共同完成的。

https://cmsa.fas.harvard.edu/wp-content/uploads/2021/04/Lecture_Ma-1.pdf

成为VIP会员查看完整内容
100

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
重磅!几何深度学习 新书,160页pdf阐述
专知会员服务
259+阅读 · 2021年4月29日
【经典书】信息论与统计: 教程,116页pdf
专知会员服务
59+阅读 · 2021年3月27日
专知会员服务
112+阅读 · 2021年3月23日
【经典书】信息论原理,774页pdf
专知会员服务
255+阅读 · 2021年3月22日
专知会员服务
181+阅读 · 2021年1月8日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
非凸优化与统计学,89页ppt,普林斯顿Yuxin Chen博士
专知会员服务
102+阅读 · 2020年6月28日
深入卷积神经网络背后的数学原理
人工智能学家
10+阅读 · 2019年4月26日
图卷积网络介绍及进展【附PPT与视频资料】
人工智能前沿讲习班
24+阅读 · 2019年1月3日
卷积神经网络简明教程
论智
8+阅读 · 2018年8月24日
PCA的基本数学原理
算法与数学之美
11+阅读 · 2017年8月8日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Arxiv
4+阅读 · 2018年4月26日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
4+阅读 · 2018年2月19日
Arxiv
8+阅读 · 2018年1月25日
Arxiv
6+阅读 · 2017年12月7日
VIP会员
相关VIP内容
重磅!几何深度学习 新书,160页pdf阐述
专知会员服务
259+阅读 · 2021年4月29日
【经典书】信息论与统计: 教程,116页pdf
专知会员服务
59+阅读 · 2021年3月27日
专知会员服务
112+阅读 · 2021年3月23日
【经典书】信息论原理,774页pdf
专知会员服务
255+阅读 · 2021年3月22日
专知会员服务
181+阅读 · 2021年1月8日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
非凸优化与统计学,89页ppt,普林斯顿Yuxin Chen博士
专知会员服务
102+阅读 · 2020年6月28日
相关资讯
深入卷积神经网络背后的数学原理
人工智能学家
10+阅读 · 2019年4月26日
图卷积网络介绍及进展【附PPT与视频资料】
人工智能前沿讲习班
24+阅读 · 2019年1月3日
卷积神经网络简明教程
论智
8+阅读 · 2018年8月24日
PCA的基本数学原理
算法与数学之美
11+阅读 · 2017年8月8日
相关论文
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Arxiv
4+阅读 · 2018年4月26日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
4+阅读 · 2018年2月19日
Arxiv
8+阅读 · 2018年1月25日
Arxiv
6+阅读 · 2017年12月7日
微信扫码咨询专知VIP会员