成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
斯坦福大学新研究:声波、光波等都是RNN
2020 年 1 月 30 日
机器之心
选自Reddit
作
者:
Ian Williamson
机器之心编译
参与:王子嘉、魔王
斯坦福大学的一项研究发现:物理学中波动与 RNN 中的计算存在对应关系。
论文地址:
https://advances.sciencemag.org/content/5/12/eaay6946
GitHub 地址:
https://github.com/fancompute/wavetorch
最近,机器学习与物理和数值科学的一些领域碰撞出了不少火花。这让机器学习框架在物理模型优化问题中有了用武之地,同时机器学习领域也在物理概念的帮助下出现了很多令人兴奋的新模型(如神经 ODE 和哈密顿神经网络等)。
本文作者所在小组的研究重点是:物理本身就可以作为计算引擎。换句话说,作者们感兴趣的是那些可以作为硬件加速器(或是专门用于快速高效的机器学习计算的模拟处理器)的物理系统。
他们最近发表在《Science Advances》上的论文,证明了波的物理特性可被直接映射到循环神经网络的时序变化。利用这种联系,作者们通过 PyTorch 开发了一个数值模型,该模型证明我们可以训练一个声学/光学系统,并利用它从人类说话者录音中准确地识别出元音。本质上,作者们将元音元音波形引入物理模型,并允许优化器在域内的 1000 个点上添加和删除材料,这个操作实际上可以当做模型的权重。
因为这个机器学习模型实际上对应于一个物理系统,这也就意味着研究者可以把经过训练的材料分布「打印」到真实的物理设备中。其结果类似于 ASIC (Application Specific Integrated Circuit),但只能针对特定的 RNN 计算。这令人感到非常兴奋,因为这些结果表明可以在不消耗多余能量(除了脉冲本身携带的能量)的情况下,执行复杂的循环机器学习计算。
以下是对这篇研究核心思想的介绍。
波动与 RNN 的联系
这一部分将介绍 RNN 的操作与波动之间的联系。
RNN 一步步对输入序列的每一部分执行相同的操作,从而将输入序列转换成输出序列(图 1A)。之前步的信息被编码存储在 RNN 的隐藏状态中,隐藏状态在每一步都会更新。正是这些隐藏状态使得 RNN 记住过去的信息,同时学习数据中的时序结构和长距离依赖关系。在给定时间步 t 处,RNN 同时处理输入序列中的当前输入向量 x_t 以及前一步传来的隐藏状态向量 h_t-1,从而得到输出向量 y_t,并更新当下的隐藏状态 h_t。
图 1:
标准 RNN 与基于波的物理系统之间的概念比较。
训练一个分辨元音的物理系统
这一部分将说明如何使用波动方程来训练元音分类器,其主要通过构建非均匀材料分布来实现。为了完成这个任务,该研究所用数据集包含 45 位男性和 48 位女性关于 10 个元音的 930 条原始录音。在模型训练过程中,该研究选取了关于这 3 个元音(ae、ei、iy)的 279 条录音作为训练集(图 2A)。
图 2:
元音识别的设置和训练过程示意图。
对初始网络 5 次交叉验证训练的结果取均值后得到的训练集与测试集上的混淆矩阵参见图 3(A、B)。混淆矩阵中对角线上的值定义了正确预测元音的比例,非对角线上的值则是未能正确预测的比例。从结果可以看出,初始结构是无法完成识别任务的。
图 3 中的 C 和 D 展示了优化后训练集和测试集上的最终混淆矩阵。这些结果同样是对 5 次交叉验证运行的结果取均值得到的。训练后的混淆矩阵是对角占优的,也就是说现在这个结构可以执行元音识别任务了。
图 3:
元音识别任务的训练结果。
图 3 中的 E 和 F 分别展示了交叉熵损失和预测准确率,横坐标是训练集和测试集上的训练 epoch 数。图中的实线表示平均值,阴影区域则是交叉验证训练运行的标准差。从中我们看到第一个 epoch 使损失下降了最多,而且对于准确率的提升也是最大的。从图 3F 中可以看出,这个系统在训练集上的平均准确率是 92.6 ±1.1%,而在测试集上的平均准确率是 86.3 ± 4.3%。
从图 3 的 C 和 D 中可以观察到系统在元音 ae 的识别上表现近乎完美,也能很好地将 iy 和 ei 分辨开来(不过准确率稍低),这种特征在测试集的未见样本上尤为明显。图 3 的 G 到 I 展示了:将每个元音类的代表性样本注入到训练结构中时的综合场强分布(integrated field intensity)∑_t u_t^2。
该研究用视觉化的方式证明了,产生目标结构的优化过程将大部分信号发送至正确的地方。该任务以传统 RNN 作为性能基准,其分类准确率与波动方程差不多,但是它需要大量自由参数。此外,我们观察到,训练线性波动方程所获得的分类准确率也是很有竞争力的,有关性能的更多细节会参见原论文。
讨论
该研究提出的这种基于波的 RNN 有很多优势,这些优势使得它在处理时序编码信息时可以得心应手。与传统 RNN 不同,波动方程在从一个时间步到另一个时间步的更新过程中,通过拉普拉斯算子(图 1E 中的稀疏矩阵)实现隐藏状态元素之间的最近邻耦合。最近邻耦合主要得益于,波动方程是信息以有限速度传播的双曲型偏微分方程。因此,模拟 RNN 的隐藏状态大小和存储容量直接取决于传播介质的大小。此外,与传统 RNN 不同的是,波动方程遵循能量守恒约束,防止隐藏状态和输出信号的范数无限增长。相比之下,定义标准 RNN 更新关系的无约束密集矩阵会导致梯度消失和爆炸,这是传统 RNN 训练过程中的主要挑战。
该研究证明波动方程在概念上等价于 RNN。这种概念上的联系为一类新的模拟硬件平台提供了思路,在这类平台中,演化时序在物理和数据集中都扮演着重要的角色。当我们专注于用标量波动方程描述的最普遍波动示例时,我们的结果可以很容易地扩展到其他类似于波的物理概念。这种利用物理执行计算的方法可能促进新型模拟机器学习设备新平台的研发,模拟设备有望比对应的数字设备更自然高效地执行计算。该方法的通用性进一步表明,许多物理系统可能是对动态信号(如光学、声学或地震学中的动态信号)执行类 RNN 计算的有力候选者。
参考链接:
https://www.reddit.com/r/MachineLearning/comments/ej3bgf/r_acoustic_optical_and_other_types_of_waves_are/
本
文为机器之心编译,
转载请联系本公众号获得授权
。
✄------------------------------------------------
加入机器之心(全职记者 / 实习生):
hr@jiqizhixin.com
投稿或寻求报道:content
@jiqizhixin.com
广告 & 商务合作:
bd@jiqizhixin.com
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
RNN
关注
7
RNN:循环神经网络,是深度学习的一种模型。
FPGA加速系统开发工具设计:综述与实践
专知会员服务
66+阅读 · 2020年6月24日
【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
94+阅读 · 2020年6月19日
【斯坦福大学博士论文】统计模型的代数与机器表示,224页pdf
专知会员服务
34+阅读 · 2020年6月18日
一份循环神经网络RNNs简明教程,37页ppt
专知会员服务
173+阅读 · 2020年5月6日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
121+阅读 · 2020年5月6日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
专知会员服务
104+阅读 · 2020年2月20日
【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别
专知会员服务
51+阅读 · 2020年2月16日
【Science论文】基于波的物理现象作为一种模拟递归神经网络(Wave physics as an analog recurrent neural network)
专知会员服务
12+阅读 · 2020年1月3日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
26+阅读 · 2019年11月19日
【斯坦福大学】用于生物医学图像分割的机器学习技术:技术方面的概述和技术应用的介绍
专知会员服务
42+阅读 · 2019年11月8日
斯坦福华人教授:声波、光波,其实都是RNN!机器学习模型对应物理系统
新智元
6+阅读 · 2020年1月4日
ICLR 2019 | 与胶囊网络异曲同工:Bengio等提出四元数循环神经网络
机器之心
3+阅读 · 2019年2月9日
使用RNN-Transducer进行语音识别建模【附PPT与视频资料】
人工智能前沿讲习班
74+阅读 · 2019年1月29日
三次简化一张图:一招理解LSTM/GRU门控机制
机器之心
15+阅读 · 2018年12月18日
前沿 | CNN取代RNN?当序列建模不再需要循环网络
机器之心
3+阅读 · 2018年8月7日
Word2Vec —— 深度学习的一小步,自然语言处理的一大步
AI研习社
21+阅读 · 2018年6月14日
学界 | 新型循环神经网络IndRNN:可构建更长更深的RNN(附GitHub实现)
机器之心
5+阅读 · 2018年3月19日
如何用 RNN 实现语音识别?| 分享总结
AI研习社
3+阅读 · 2017年12月15日
爆款论文提出简单循环单元SRU:像CNN一样快速训练RNN(附开源代码)
机器之心
3+阅读 · 2017年9月12日
CNN、RNN在自动特征提取中的应用
乌镇智库
14+阅读 · 2017年8月4日
Adversarial NLI: A New Benchmark for Natural Language Understanding
Arxiv
4+阅读 · 2019年10月31日
A Comparative Study on Transformer vs RNN in Speech Applications
Arxiv
4+阅读 · 2019年9月13日
Red blood cell image generation for data augmentation using Conditional Generative Adversarial Networks
Arxiv
4+阅读 · 2019年1月18日
Fast and Accurate 3D Medical Image Segmentation with Data-swapping Method
Arxiv
5+阅读 · 2018年12月19日
Monocular Total Capture: Posing Face, Body, and Hands in the Wild
Arxiv
4+阅读 · 2018年12月4日
Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks
Arxiv
4+阅读 · 2018年11月21日
Few-shot 3D Multi-modal Medical Image Segmentation using Generative Adversarial Learning
Arxiv
9+阅读 · 2018年10月29日
Reversible Recurrent Neural Networks
Arxiv
3+阅读 · 2018年10月25日
Learning with Interpretable Structure from RNN
Arxiv
19+阅读 · 2018年10月25日
Generative Adversarial Autoencoder Networks
Arxiv
11+阅读 · 2018年3月23日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
RNN
物理系统
斯坦福大学 (Stanford University)
混淆矩阵
机器学习
训练集
相关VIP内容
FPGA加速系统开发工具设计:综述与实践
专知会员服务
66+阅读 · 2020年6月24日
【斯坦福大学博士论文】自监督场景表示学习, 97页pdf
专知会员服务
94+阅读 · 2020年6月19日
【斯坦福大学博士论文】统计模型的代数与机器表示,224页pdf
专知会员服务
34+阅读 · 2020年6月18日
一份循环神经网络RNNs简明教程,37页ppt
专知会员服务
173+阅读 · 2020年5月6日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
121+阅读 · 2020年5月6日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
专知会员服务
104+阅读 · 2020年2月20日
【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别
专知会员服务
51+阅读 · 2020年2月16日
【Science论文】基于波的物理现象作为一种模拟递归神经网络(Wave physics as an analog recurrent neural network)
专知会员服务
12+阅读 · 2020年1月3日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
26+阅读 · 2019年11月19日
【斯坦福大学】用于生物医学图像分割的机器学习技术:技术方面的概述和技术应用的介绍
专知会员服务
42+阅读 · 2019年11月8日
热门VIP内容
开通专知VIP会员 享更多权益服务
【ICLR2025】通过自适应对比学习优化大规模语言模型的知识
【ETHZ博士论文】混合型无人机的安全感知学习与控制
哈工大团队:首篇DeepSeek R1的多语言能力全面分析!
先进人工智能的多智能体风险
相关资讯
斯坦福华人教授:声波、光波,其实都是RNN!机器学习模型对应物理系统
新智元
6+阅读 · 2020年1月4日
ICLR 2019 | 与胶囊网络异曲同工:Bengio等提出四元数循环神经网络
机器之心
3+阅读 · 2019年2月9日
使用RNN-Transducer进行语音识别建模【附PPT与视频资料】
人工智能前沿讲习班
74+阅读 · 2019年1月29日
三次简化一张图:一招理解LSTM/GRU门控机制
机器之心
15+阅读 · 2018年12月18日
前沿 | CNN取代RNN?当序列建模不再需要循环网络
机器之心
3+阅读 · 2018年8月7日
Word2Vec —— 深度学习的一小步,自然语言处理的一大步
AI研习社
21+阅读 · 2018年6月14日
学界 | 新型循环神经网络IndRNN:可构建更长更深的RNN(附GitHub实现)
机器之心
5+阅读 · 2018年3月19日
如何用 RNN 实现语音识别?| 分享总结
AI研习社
3+阅读 · 2017年12月15日
爆款论文提出简单循环单元SRU:像CNN一样快速训练RNN(附开源代码)
机器之心
3+阅读 · 2017年9月12日
CNN、RNN在自动特征提取中的应用
乌镇智库
14+阅读 · 2017年8月4日
相关论文
Adversarial NLI: A New Benchmark for Natural Language Understanding
Arxiv
4+阅读 · 2019年10月31日
A Comparative Study on Transformer vs RNN in Speech Applications
Arxiv
4+阅读 · 2019年9月13日
Red blood cell image generation for data augmentation using Conditional Generative Adversarial Networks
Arxiv
4+阅读 · 2019年1月18日
Fast and Accurate 3D Medical Image Segmentation with Data-swapping Method
Arxiv
5+阅读 · 2018年12月19日
Monocular Total Capture: Posing Face, Body, and Hands in the Wild
Arxiv
4+阅读 · 2018年12月4日
Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks
Arxiv
4+阅读 · 2018年11月21日
Few-shot 3D Multi-modal Medical Image Segmentation using Generative Adversarial Learning
Arxiv
9+阅读 · 2018年10月29日
Reversible Recurrent Neural Networks
Arxiv
3+阅读 · 2018年10月25日
Learning with Interpretable Structure from RNN
Arxiv
19+阅读 · 2018年10月25日
Generative Adversarial Autoencoder Networks
Arxiv
11+阅读 · 2018年3月23日
大家都在搜
自主可控
锂电池
大型语言模型
全面综述
模型综述
量化交易
火星月球
uuv
铁塔
城市绿色交通发展评价指标体系和方法研究
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top