被拉格朗日力学支配的神经网络

2020 年 1 月 3 日 极市平台

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~


作者:hahakity
链接:https://zhuanlan.zhihu.com/p/90126722
本文已由作者授权转载,未经允许,不得二次转载


看到有人往 ICLR2019 投了一篇好玩的文章 Deep Lagrangian Networks (DeLaN),这里做个推荐式简介。机器人科学里有两个著名的问题,正问题与逆问题。
  1. 正问题:已知机器人各个关节处电机的驱动力,预测机械臂最终到达的位置,动量和加速度。
  2. 逆问题:为了将机械臂移动到指定位置且拥有指定的动量和加速度( 比如想以某个角度某种力度打脸),机器人各个关节处电机驱动力需要如何分配。

如果使用传统的深度学习,解决机器人的逆问题,可能会出现意想不到的问题。就算训练数据满足所有的物理规律,训练好的人工神经网络仍然可能做出非物理的预测。外插无约束。
此外,有一些场景不适用刚体运动学。甚至很难用物理公式计算,比如下面这些场景:
  • 柔性关节,关节之间用弹簧或绳子连接,而弹性系数并无数值
  • 流体身躯,体内有半满的液体,内部质量分布随身躯的姿态而变化
  • 摩擦力
    • 关节之间存在静摩擦力与动摩擦力
    • 脚底与地面之间存在静摩擦力与动摩擦力

这篇文章将欧拉拉格朗日方程中的物体质量矩阵用神经网络表示,从而可以估计质量分布与机器人姿态之间的关系;将机器人各部分受到的力(比如万有引力,弹簧拉力,关节摩擦力,以及与地面的摩擦力),用神经网络表示,解决柔性关节与摩擦力不好理论计算的难题。质量矩阵构造的时候,使用技巧使其满足半正定(即质量只能大于等于零,而不能小于零)。逆问题的解用拉格朗日方程和质量矩阵,外力表示。
深度拉格朗日网络学会了力学系统的运动方程,比传统的前馈神经网络训练速度更快,预测结果更物理,对新的径迹预测也更健壮。

黑色:标准答案;红色:拉格朗日网络。第一列:让机器人写字母'd', 'a', 'e' 需要的驱动力;第二列:惯性力 F=ma; 第三列:科里奥利力与离心力;第四列:引力;第五列:蓝色对应普通前馈神经网络的测试误差,红色对应拉格朗日网络测试误差


文章公式简介


1. 正问题和逆问题的数学表达式:

正问题: 
逆问题: 
其中     表示坐标,     表示速度,     表示加速度,     表示电机驱动力。

2.  拉格朗日

  其中 T 是动能项,V是势能项。
文章中动能写成     的形式, 其中     是与坐标相关的质量矩阵,可以描述流体身躯。    是速度,动能项翻译成大家熟悉的形式就是,     。
势能与引力,弹簧的拉力等相关,力 g(q) 与势能的关系是:     。写成熟悉的形式,引力势能 V = mgh, 万有引力     。


3. 非守恒力的拉格朗日方程

如果右边的     , 上面这个方程就是常见的没有外力的拉格朗日方程。加了   表示这个系统有电机的驱动力输入。

4. 将欧拉拉格朗日方程中的动能和势能用之前的形式替换,

注意:与逆问题的最原始形式对比,上述方程的左边等于     。
然后将质量矩阵写成半正定的神经网络表示, 将势能对应的力也用神经网络表示,

L 是下三角矩阵, 从构造上让质量矩阵半正定 【使用 ReLU 激活函数 ReLU(x) = max(0,x) 为L矩阵添加大于等于零的对角元 】。    和     是神经网络参数。此时逆问题变成了
训练的优化目标定为最小化     和     之间的距离,

后面     项是 L2 loss,来约束参数     的值。


参考文献

[1] https://pybullet.org/wordpress/

[2] https://openreview.net/forum?id=BklHpjCqKm

参考文献 2 是开放评审的 Referee report 和 Reply,大部分评审员对这篇文章持积极正面意见。


文章截图

文章题目: “深度拉格朗日网络”
副标题: “使用物理作为深度学习的模型先验”。
作者: 德国达姆斯塔特技术学院计算机系 Michael Lutter, Christian Ritter 和 Jan Peters。




-End-



*延伸阅读




CV细分方向交流群


添加极市小助手微信(ID : cv-mart),备注:研究方向-姓名-学校/公司-城市(如:目标检测-小极-北大-深圳),即可申请加入目标检测、目标跟踪、人脸、工业检测、医学影像、三维&SLAM、图像分割等极市技术交流群(已经添加小助手的好友直接私信),更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流一起来让思想之光照的更远吧~



△长按添加极市小助手


△长按关注极市平台


觉得有用麻烦给个在看啦~  

登录查看更多
3

相关内容

【UCLA】基于深度神经网络的工业大模型预测控制,36页ppt
专知会员服务
73+阅读 · 2020年5月21日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
32+阅读 · 2020年4月15日
【BAAI|2019】类脑神经网络技术及其应用,鲁华祥(附pdf)
专知会员服务
29+阅读 · 2019年11月21日
神经网络与深度学习,复旦大学邱锡鹏老师
专知会员服务
118+阅读 · 2019年9月24日
真正的神经网络,敢于不学习权重
极市平台
4+阅读 · 2019年6月14日
吴恩达团队:神经网络如何正确初始化?
AI100
11+阅读 · 2019年5月15日
神经网络训练tricks
极市平台
6+阅读 · 2019年4月15日
论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型
开放知识图谱
31+阅读 · 2019年4月7日
【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上
机器学习研究会
4+阅读 · 2018年3月10日
深度学习面试你必须知道这些答案
AI研习社
18+阅读 · 2017年10月31日
神经网络中的「注意力」是什么?怎么用?
人工智能学家
5+阅读 · 2017年10月19日
如何为LSTM重新构建输入数据(Keras)
全球人工智能
6+阅读 · 2017年10月13日
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
15+阅读 · 2019年9月11日
Neural Arithmetic Logic Units
Arxiv
5+阅读 · 2018年8月1日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
5+阅读 · 2018年5月5日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关资讯
真正的神经网络,敢于不学习权重
极市平台
4+阅读 · 2019年6月14日
吴恩达团队:神经网络如何正确初始化?
AI100
11+阅读 · 2019年5月15日
神经网络训练tricks
极市平台
6+阅读 · 2019年4月15日
论文浅尝 | 面向知识图谱补全的共享嵌入神经网络模型
开放知识图谱
31+阅读 · 2019年4月7日
【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上
机器学习研究会
4+阅读 · 2018年3月10日
深度学习面试你必须知道这些答案
AI研习社
18+阅读 · 2017年10月31日
神经网络中的「注意力」是什么?怎么用?
人工智能学家
5+阅读 · 2017年10月19日
如何为LSTM重新构建输入数据(Keras)
全球人工智能
6+阅读 · 2017年10月13日
相关论文
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
15+阅读 · 2019年9月11日
Neural Arithmetic Logic Units
Arxiv
5+阅读 · 2018年8月1日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
5+阅读 · 2018年5月5日
Arxiv
5+阅读 · 2015年9月14日
Top
微信扫码咨询专知VIP会员