来自南京大学的赵鹏博士论文,入选2023年度“CCF博士学位论文激励计划”初评名单!

https://www.ccf.org.cn/Focus/2023-11-29/798503.shtml

传统的机器学习方法通常假设学习环境静态不变,然而真实世界环境往往 动态变化。特别是在大数据时代,数据不断随时间累积得到,数据分布常常也 不断随时间变化。因此,如何建立对数据分布在线变化环境稳健的机器学习理 论与方法,成为机器学习研究的新挑战。本文提出“在线集成”这一学习框架,用以指导稳健在线学习的理论分析 与算法设计。针对在线学习的四种典型情况,本文在该框架下分别提出相应的 在线集成方法,不仅通过实验验证了性能,并理论证明提出方法在各自对应问 题上分别达到了(当前)理论上所能达到的最优动态遗憾保障,初步建立起稳 健在线学习的一般性解决框架。本文主要工作包括:

  1. 完全信息在线学习 对学习者可以获得每轮在线函数梯度信息的情况,本文 提出了一种新颖的在线集成方法,通过合理构建基学习器—结合学习器结 构以自适应重用历史梯度信息,总体方法能够有效应对数据分布变化,并 对不同问题实例具有问题相关的性能保障。理论证明了本文方法具有当前 最优的动态遗憾界,实验进一步验证了方法的有效性。
  2. 凸赌博机在线学习 对学习者无法获得每轮在线函数梯度信息,只能获得单 点/双点函数值信息的情况,本文通过构建替代损失函数以高效利用有限的 信息反馈,设计了一种能够应用到赌博机反馈场景的在线集成方法。本文 首次建立了凸赌博机在线学习问题的动态遗憾理论,该结果在双点反馈模 型已达到理论最优,实验进一步验证了方法的有效性。
  3. 带噪赌博机在线学习 对学习者无法获得每轮在线函数梯度信息,只能获得 带噪声污染的函数值信息的情况,本文考察线性损失函数,通过最小二乘 法估计未知参数并计算上置信界以选择每轮决策,通过周期性重启机制赋 予学习器处理环境动态变化的能力,并进一步设计双层赌博机的串行在线集成结构以自适应选取最优重启间隔。理论证明了本文方法具有当前最优 的动态遗憾界,实验进一步验证了方法的有效性。
  4. 决策控制在线学习 对决策控制在线学习这类存在状态转移,学习者决策会 影响未来在线函数梯度及函数值信息的情况,本文考察在线非随机控制设 定,通过分析问题性质将其转化为具有记忆的在线凸优化问题,并设计新 颖的正则化替代损失实现一种具有低转化损失的在线集成方法,从而有效 处理决策控制过程的记忆问题。本文首次建立了在线非随机控制问题的动 态策略遗憾理论,实验进一步验证了方法的有效性。

成为VIP会员查看完整内容
26

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【博士论文】动态三维场景理解与重建
专知会员服务
37+阅读 · 2023年12月3日
【博士论文】大规模预训练语言模型的高效适配技术研究
专知会员服务
54+阅读 · 2023年11月29日
【博士论文】图像数据先验的数学建模及其应用
专知会员服务
22+阅读 · 2022年12月29日
【博士论文】面向大规模部署的室内定位关键技术研究
专知会员服务
24+阅读 · 2022年12月19日
【博士论文】开放域文本的结构化知识获取
专知会员服务
47+阅读 · 2022年12月17日
【博士论文】深度学习的对抗攻击与鲁棒性测评
专知会员服务
74+阅读 · 2022年12月9日
【长文综述】基于图神经网络的知识图谱研究进展
深度学习自然语言处理
14+阅读 · 2020年8月23日
论文浅尝 | 可建模语义分层的知识图谱补全方法
开放知识图谱
30+阅读 · 2020年3月8日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【博士论文】动态三维场景理解与重建
专知会员服务
37+阅读 · 2023年12月3日
【博士论文】大规模预训练语言模型的高效适配技术研究
专知会员服务
54+阅读 · 2023年11月29日
【博士论文】图像数据先验的数学建模及其应用
专知会员服务
22+阅读 · 2022年12月29日
【博士论文】面向大规模部署的室内定位关键技术研究
专知会员服务
24+阅读 · 2022年12月19日
【博士论文】开放域文本的结构化知识获取
专知会员服务
47+阅读 · 2022年12月17日
【博士论文】深度学习的对抗攻击与鲁棒性测评
专知会员服务
74+阅读 · 2022年12月9日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员