被拉格朗日力学支配的神经网络

2020 年 1 月 3 日 极市平台

加入极市专业CV交流群，与6000+来自腾讯，华为，百度，北大，清华，中科院等名企名校视觉开发者互动交流！更有机会与李开复老师等大牛群内互动！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。关注 极市平台 公众号，回复 加群，立刻申请入群~

作者：hahakity

链接：https://zhuanlan.zhihu.com/p/90126722

本文已由作者授权转载，未经允许，不得二次转载

看到有人往 ICLR2019 投了一篇好玩的文章 Deep Lagrangian Networks (DeLaN)，这里做个推荐式简介。机器人科学里有两个著名的问题，正问题与逆问题。

正问题：已知机器人各个关节处电机的驱动力，预测机械臂最终到达的位置，动量和加速度。
逆问题：为了将机械臂移动到指定位置且拥有指定的动量和加速度（比如想以某个角度某种力度打脸），机器人各个关节处电机驱动力需要如何分配。

如果使用传统的深度学习，解决机器人的逆问题，可能会出现意想不到的问题。就算训练数据满足所有的物理规律，训练好的人工神经网络仍然可能做出非物理的预测。外插无约束。

此外，有一些场景不适用刚体运动学。甚至很难用物理公式计算，比如下面这些场景：

柔性关节，关节之间用弹簧或绳子连接，而弹性系数并无数值
流体身躯，体内有半满的液体，内部质量分布随身躯的姿态而变化
摩擦力

关节之间存在静摩擦力与动摩擦力
脚底与地面之间存在静摩擦力与动摩擦力

这篇文章将欧拉拉格朗日方程中的物体质量矩阵用神经网络表示，从而可以估计质量分布与机器人姿态之间的关系；将机器人各部分受到的力（比如万有引力，弹簧拉力，关节摩擦力，以及与地面的摩擦力），用神经网络表示，解决柔性关节与摩擦力不好理论计算的难题。质量矩阵构造的时候，使用技巧使其满足半正定（即质量只能大于等于零，而不能小于零）。逆问题的解用拉格朗日方程和质量矩阵，外力表示。

深度拉格朗日网络学会了力学系统的运动方程，比传统的前馈神经网络训练速度更快，预测结果更物理，对新的径迹预测也更健壮。

文章公式简介

1. 正问题和逆问题的数学表达式：

正问题：

逆问题：

其中表示坐标，表示速度，表示加速度，表示电机驱动力。

2. 拉格朗日

其中 T 是动能项，V是势能项。

文章中动能写成的形式, 其中是与坐标相关的质量矩阵，可以描述流体身躯。是速度，动能项翻译成大家熟悉的形式就是，。

势能与引力，弹簧的拉力等相关，力 g(q) 与势能的关系是: 。写成熟悉的形式，引力势能 V = mgh, 万有引力。

3. 非守恒力的拉格朗日方程

如果右边的 , 上面这个方程就是常见的没有外力的拉格朗日方程。加了表示这个系统有电机的驱动力输入。

4. 将欧拉拉格朗日方程中的动能和势能用之前的形式替换，

注意：与逆问题的最原始形式对比，上述方程的左边等于。

然后将质量矩阵写成半正定的神经网络表示, 将势能对应的力也用神经网络表示，

L 是下三角矩阵, 从构造上让质量矩阵半正定【使用 ReLU 激活函数 ReLU(x) = max(0,x) 为L矩阵添加大于等于零的对角元】。和是神经网络参数。此时逆问题变成了

训练的优化目标定为最小化和之间的距离，

后面项是 L2 loss，来约束参数的值。

参考文献

[1] https://pybullet.org/wordpress/

[2] https://openreview.net/forum?id=BklHpjCqKm

参考文献 2 是开放评审的 Referee report 和 Reply，大部分评审员对这篇文章持积极正面意见。

文章截图

文章题目: “深度拉格朗日网络”

副标题: “使用物理作为深度学习的模型先验”。

作者: 德国达姆斯塔特技术学院计算机系 Michael Lutter, Christian Ritter 和 Jan Peters。

-End-

*延伸阅读

CV细分方向交流群

添加极市小助手微信（ID : cv-mart），备注：研究方向-姓名-学校/公司-城市（如：目标检测-小极-北大-深圳），即可申请加入目标检测、目标跟踪、人脸、工业检测、医学影像、三维&SLAM、图像分割等极市技术交流群（已经添加小助手的好友直接私信），更有每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流，一起来让思想之光照的更远吧~