【NeurIPS2021】非凸从动件的基于梯度的双层优化 - 专知VIP

会员服务 ·

0

NeurIPS 2021 · 非凸优化 · 梯度下降 ·

2021 年 10 月 12 日

【NeurIPS2021】非凸从动件的基于梯度的双层优化

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

该论文题为Towards Gradient-based Bilevel Optimization with Non-convex Followers and Beyond，从新的视角来构造逼近框架，设计了Initialization Auxiliary and Pessimistic Trajectory Truncated Gradient Method (IAPTT-GM)，解决下层非凸问题。具体来说，针对下层非凸结构特点，设计梯度下降迭代模块，利用迭代初始点作为额外的控制元（Initialization Auxiliary），构造对下层最优解的逼近；另一方面，从理论分析与降低计算负担两个角度，在外层迭代中引入（Pessimistic Trajectory Truncation）机制，构造对上层目标的有效逼近。在基于元学习的小样本分类任务与超参数优化数据超清洗任务上，论文验证了当下层问题有非凸结构时，IAPTT-GM与现有流行算法相比，具有明显的优势。

https://www.zhuanzhi.ai/paper/67ba4c9895d646ab8376a36ebbd0e9db

成为VIP会员查看完整内容

13

相关内容

NeurIPS 2021

【NeurIPS2021】序一致因果图的多任务学习

【NeurIPS2021】序一致因果图的多任务学习

专知会员服务

20+阅读 · 2021年11月7日

【ICML2021】去中心化分布式训练的最优复杂度

专知会员服务

25+阅读 · 2021年9月28日

【ICML2021】具有持续进化策略的展开计算图的无偏梯度估计

专知会员服务

11+阅读 · 2021年8月10日

【ICML2021】基于数据采样的影响力最大化问题

专知会员服务

21+阅读 · 2021年8月1日

【ICML2021】基于共享表示的个性化联邦学习

专知会员服务

15+阅读 · 2021年7月21日

【ICML2021】双加速的快速间隔最大化

专知会员服务

12+阅读 · 2021年7月4日

【ICML2021】密度约束强化学习

专知会员服务

22+阅读 · 2021年6月26日

【NeurIPS2020】用于鲁棒估计和自动结构发现的多任务加性模型

专知会员服务

9+阅读 · 2020年12月21日

【AAAI2021】近似梯度下降的学习图神经网络

专知会员服务

20+阅读 · 2020年12月9日

【NeurIPS2020】梯度增强的转导优化和泛化分析及在多尺度图神经网络中的应用

专知会员服务

14+阅读 · 2020年9月27日

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

神经网络的损失函数为什么是非凸的?

神经网络的损失函数为什么是非凸的?

极市平台

12+阅读 · 2019年9月26日

KDD 2019 | 不用反向传播就能训练DL模型，ADMM效果可超梯度下降

KDD 2019 | 不用反向传播就能训练DL模型，ADMM效果可超梯度下降

机器之心

4+阅读 · 2019年8月29日

ResNet架构可逆！多大等提出性能优越的可逆残差网络

ResNet架构可逆！多大等提出性能优越的可逆残差网络

机器之心

5+阅读 · 2019年2月3日

深度 | 如何理解深度学习的优化？通过分析梯度下降的轨迹

深度 | 如何理解深度学习的优化？通过分析梯度下降的轨迹

机器之心

7+阅读 · 2018年11月20日

【学界】NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

【学界】NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

GAN生成式对抗网络

9+阅读 · 2018年11月2日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

如何改进梯度下降算法

如何改进梯度下降算法

论智

9+阅读 · 2018年4月19日

算法优化｜梯度下降和随机梯度下降 — 从0开始

算法优化｜梯度下降和随机梯度下降 — 从0开始

全球人工智能

8+阅读 · 2017年12月25日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

Linear algebra with transformers

Arxiv

0+阅读 · 2021年12月3日

Optimized variance estimation under interference and complex experimental designs

Arxiv

0+阅读 · 2021年12月3日

Towards Gradient-based Bilevel Optimization with Non-convex Followers and Beyond

Arxiv

5+阅读 · 2021年10月1日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Unbalanced minibatch Optimal Transport; applications to Domain Adaptation

Arxiv

3+阅读 · 2021年3月5日

Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

Arxiv

5+阅读 · 2020年4月2日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

Self-Attention Graph Pooling

Self-Attention Graph Pooling

Arxiv

5+阅读 · 2019年4月17日

Human Interaction with Recommendation Systems

Arxiv

6+阅读 · 2018年3月28日

Twitter Sentiment Analysis

Arxiv

5+阅读 · 2015年9月14日

VIP会员

相关主题

相关VIP内容

【NeurIPS2021】序一致因果图的多任务学习

【NeurIPS2021】序一致因果图的多任务学习

专知会员服务

20+阅读 · 2021年11月7日

【ICML2021】去中心化分布式训练的最优复杂度

专知会员服务

25+阅读 · 2021年9月28日

【ICML2021】具有持续进化策略的展开计算图的无偏梯度估计

专知会员服务

11+阅读 · 2021年8月10日

【ICML2021】基于数据采样的影响力最大化问题

专知会员服务

21+阅读 · 2021年8月1日

【ICML2021】基于共享表示的个性化联邦学习

专知会员服务

15+阅读 · 2021年7月21日

【ICML2021】双加速的快速间隔最大化

专知会员服务

12+阅读 · 2021年7月4日

【ICML2021】密度约束强化学习

专知会员服务

22+阅读 · 2021年6月26日

【NeurIPS2020】用于鲁棒估计和自动结构发现的多任务加性模型

专知会员服务

9+阅读 · 2020年12月21日

【AAAI2021】近似梯度下降的学习图神经网络

专知会员服务

20+阅读 · 2020年12月9日

【NeurIPS2020】梯度增强的转导优化和泛化分析及在多尺度图神经网络中的应用

专知会员服务

14+阅读 · 2020年9月27日

热门VIP内容

开通专知VIP会员享更多权益服务

GPT-5如何对齐？从硬性拒绝到安全完成：走向以输出为中心的安全训练

【伯克利博士论文】超越人类监督的视觉智能

【ICCV2025】SO(3) 上连续非保守动力系统的预测

2025年中国数据要素行业发展研究报告

相关资讯

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

神经网络的损失函数为什么是非凸的?

神经网络的损失函数为什么是非凸的?

极市平台

12+阅读 · 2019年9月26日

KDD 2019 | 不用反向传播就能训练DL模型，ADMM效果可超梯度下降

KDD 2019 | 不用反向传播就能训练DL模型，ADMM效果可超梯度下降

机器之心

4+阅读 · 2019年8月29日

ResNet架构可逆！多大等提出性能优越的可逆残差网络

ResNet架构可逆！多大等提出性能优越的可逆残差网络

机器之心

5+阅读 · 2019年2月3日

深度 | 如何理解深度学习的优化？通过分析梯度下降的轨迹

深度 | 如何理解深度学习的优化？通过分析梯度下降的轨迹

机器之心

7+阅读 · 2018年11月20日

【学界】NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

【学界】NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

GAN生成式对抗网络

9+阅读 · 2018年11月2日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

如何改进梯度下降算法

如何改进梯度下降算法

论智

9+阅读 · 2018年4月19日

算法优化｜梯度下降和随机梯度下降 — 从0开始

算法优化｜梯度下降和随机梯度下降 — 从0开始

全球人工智能

8+阅读 · 2017年12月25日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

相关论文

Linear algebra with transformers

Arxiv

0+阅读 · 2021年12月3日

Optimized variance estimation under interference and complex experimental designs

Arxiv

0+阅读 · 2021年12月3日

Towards Gradient-based Bilevel Optimization with Non-convex Followers and Beyond

Arxiv

5+阅读 · 2021年10月1日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Unbalanced minibatch Optimal Transport; applications to Domain Adaptation

Arxiv

3+阅读 · 2021年3月5日

Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

Arxiv

5+阅读 · 2020年4月2日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

Self-Attention Graph Pooling

Self-Attention Graph Pooling

Arxiv

5+阅读 · 2019年4月17日

Human Interaction with Recommendation Systems

Arxiv

6+阅读 · 2018年3月28日

Twitter Sentiment Analysis

Arxiv

5+阅读 · 2015年9月14日

微信扫码咨询专知VIP会员