在本专著中,我从现代在线凸优化(Online Convex Optimization, OCO)的视角出发,介绍了在线学习(Online Learning)的基本概念。这里所说的在线学习,指的是在最坏情况下最小化后悔值(regret minimization)的理论框架。我展示了适用于凸损失函数的在线学习一阶与二阶算法,涵盖欧几里得(Euclidean)与非欧几里得(Non-Euclidean)空间的情形。所有算法均被清晰地呈现为在线镜像下降(Online Mirror Descent, OMD)或正则化引导法(Follow-The-Regularized-Leader, FTRL)及其变种的具体实例。

本书特别关注算法参数调优问题及在无界域(unbounded domains)中学习的挑战,主要通过自适应(adaptive)与无参数(parameter-free)在线学习算法加以解决。针对非凸损失函数,则引入凸替代损失(convex surrogate losses)和随机化方法进行处理。书中亦简要讨论了bandit问题,涉及对抗性与随机性多臂赌博机(multi-armed bandits)场景下的挑战。 本讲义不要求读者具备凸分析的先验知识,所需的数学工具均进行了严格、清晰的解释。此外,书中所附证明均经过精心挑选,力求简明易懂、尽可能简短。

成为VIP会员查看完整内容
3

相关内容

在计算机科学中,在线机器学习是的方法的机器学习,其中在连续的顺序数据变为可用,并且用于更新对于在每一步未来数据最好的预测,而不是其产生由学习的最佳预测批次学习技术一次对整个训练数据集。在线学习是机器学习领域中的一种常用技术,在该领域中,在计算上无法训练整个数据集是不可行的,因此需要核心算法。它也用于算法必须动态适应数据中的新模式的情况下,或者当数据本身随时间而变化时(例如,股价预测)。在线学习算法可能易于遭受灾难性干扰,这一问题可以通过增量学习方法来解决。
CLIP通用提示学习的简要概述
专知会员服务
15+阅读 · 3月13日
【普林斯顿博士论文】图机器学习,137页pdf
专知会员服务
42+阅读 · 2024年5月1日
最新《强化学习导论》教程,32页pdf
专知会员服务
58+阅读 · 2023年4月5日
【LREC2022教程】自然语言处理统一意义表示学习,113页ppt
【干货书】Python高级数据科学分析,424页pdf
专知会员服务
117+阅读 · 2020年8月7日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
357+阅读 · 2020年6月24日
【KDD2020】图神经网络:基础与应用,322页ppt
使用 Bert 预训练模型文本分类(内附源码)
数据库开发
102+阅读 · 2019年3月12日
手把手教你用LDA特征选择
AI研习社
12+阅读 · 2017年8月21日
Caffe 深度学习框架上手教程
黑龙江大学自然语言处理实验室
14+阅读 · 2016年6月12日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
453+阅读 · 2023年3月31日
Arxiv
18+阅读 · 2021年3月16日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
Arxiv
10+阅读 · 2020年11月26日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
VIP会员
相关VIP内容
CLIP通用提示学习的简要概述
专知会员服务
15+阅读 · 3月13日
【普林斯顿博士论文】图机器学习,137页pdf
专知会员服务
42+阅读 · 2024年5月1日
最新《强化学习导论》教程,32页pdf
专知会员服务
58+阅读 · 2023年4月5日
【LREC2022教程】自然语言处理统一意义表示学习,113页ppt
【干货书】Python高级数据科学分析,424页pdf
专知会员服务
117+阅读 · 2020年8月7日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
357+阅读 · 2020年6月24日
相关资讯
【KDD2020】图神经网络:基础与应用,322页ppt
使用 Bert 预训练模型文本分类(内附源码)
数据库开发
102+阅读 · 2019年3月12日
手把手教你用LDA特征选择
AI研习社
12+阅读 · 2017年8月21日
Caffe 深度学习框架上手教程
黑龙江大学自然语言处理实验室
14+阅读 · 2016年6月12日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
相关论文
A Survey of Large Language Models
Arxiv
453+阅读 · 2023年3月31日
Arxiv
18+阅读 · 2021年3月16日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
Arxiv
10+阅读 · 2020年11月26日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
微信扫码咨询专知VIP会员