近年来,SE(3) 等变网络在 3D 语义分析任务中发挥着重要的作用,尤以 3D 姿态可控卷积神经网络为代表。3D 姿态可控卷积神经网络利用姿态可控卷积(ST-Conv)逐层学习姿态等变的特征,从而保留 3D 输入的姿态信息。直观地说,对于一个 ST-Conv,关于 3D 输入的任意 SE(3) 变换(r,t),都将诱导输出特征的同步姿态变换,其中r ∈SO(3)表示旋转,表示平移。图 1(a) 进一步给出了解释,给定输入的一个 SE(3) 变换,特征向量所在位置均关于(r,t)进行刚性变换,而特征向量 ρ(r)本身也关于进行旋转(ρ(r)是旋转r的一个表征)。SE(3) 等变的特性激活了特征空间的姿态可控性,例如,SE(3) 变换可通过对特征空间进行操控来直接实现,而无需变换输入。为了生成姿态可控特征,ST-Conv 将特征域限定在 3D 体素数据的规则网格上,使其能通过 3D 卷积方便地实现。对 3D 卷积的兼容简化了 ST-Conv 的实现,但也牺牲了对不规则且稀疏的 3D 数据(例如,点云)的高效处理,导致 ST-Conv 未能在更多 3D 语义分析领域中被广泛使用。