论文:BackPACK: Packing more into Backprop 链接:https://openreview.net/forum?id=BJlrF24twB 机构:图宾根大学、不列颠哥伦比亚大学 在深度学习中,自动微分框架只在计算梯度时才是最强的。但实际上,小批量梯度的方差或者其它逼近海塞矩阵的方法,可以和梯度一样高效地计算。研究者对这些计算值非常感兴趣,但DL框架并不支持自动计算,且手动执行又异常繁杂。 为了解决这个问题,来自图宾根大学的研究者在本文中提出一种基于PyTorch的高效框架BackPACK,该框架可以扩展反向传播算法,进而从一阶和二阶导数中提取额外信息。研究者对深度神经网络上额外数量的计算进行了基准测试,并提供了一个测试最近几种曲率估算优化的示例应用,最终证实了BackPACK的性能。 BackPACK项目地址:https://github.com/toiaydcdyywlhzvlob/backpack