项目名称: 开放动态环境下在线机器学习理论与方法

项目编号: No.61333014

项目类型: 重点项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 周志华

作者单位: 南京大学

项目金额: 290万元

中文摘要: 传统的机器学习研究主要是在封闭静态环境下展开的,研究者们通常假设训练样本分布与测试样本分布相同、样本类别和属性恒定、学习目标明确唯一。随着机器学习技术逐渐走向实用,不可避免地在越来越多的任务中面临开放动态环境;在这样的环境中,训练/测试样本分布可能不同、样本类别可能增加、属性可能增加/失效、学得模型要尽可能满足不同用户的需求。本项目针对开放动态环境“分布偏移”、“类别可增”、“属性变动”和“目标多样”这四个关键因素,并由于数据量大且不断积聚而需要采用在线学习方式,拟从理论上分析上述因素对可学习性的影响,提出能有效适应分布偏移的在线学习方法、能有效适应类别增加的在线学习方法、能有效应对属性变动的在线学习方法、以及能有效适应多样化目标的在线学习方法。基于上述研究工作,本项目将在国内外重要期刊和会议发表论文15-25 篇,申请发明专利3-5 项,研制原型系统1个,培养多名博士后、研究生。

中文关键词: 机器学习;开放动态环境;在线学习;泛化;学习理论

英文摘要: Conventional machine learning researches are generally conducted in closed and static environments. These researches usually assume that the training data distribution and test data distribution are identical, the data categories and attributes are fixed, and the learning objective is clear and unique. As machine learning techniques come to real practice, open and dynamic environments are encountered in more and more tasks inevitably. In such environments, the training/test distributions can be different, the number of categories can increase, the attributes can augment or fail, the learned model need to meet different requirements of users. In this project, we will focus on the four key factors, that is, “drifting distributions”, “augmentable categories”, “varying attributes” and “various objectives”, and consider online learning style by noticing the large and accumulating data in open and dynamic environments. We plan to theoretically analyze the influences of these factors on learnability, and propose online learning approaches that are able to adapt to drifting distributions, augmentable categories, varying attributes and various objectives. As the result of this project, 15-25 high quality papers are expected to be published in leading journals and conferences, as well as 3-5 patents and a prototype system, and a number of postdocs and graduate students will be trained.

英文关键词: Machine Learning;Open Dynamic Environment;Online Learning;Generalization;Learning Theory

成为VIP会员查看完整内容
10

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
顾及时空特征的地理知识图谱构建方法
专知会员服务
53+阅读 · 2022年2月15日
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
专知会员服务
26+阅读 · 2021年9月4日
专知会员服务
34+阅读 · 2021年8月13日
专知会员服务
64+阅读 · 2021年7月25日
专知会员服务
18+阅读 · 2021年5月16日
专知会员服务
28+阅读 · 2021年2月19日
专知会员服务
48+阅读 · 2020年11月20日
微软亚洲研究院“明日之星”开放岗位
微软研究院AI头条
0+阅读 · 2021年12月21日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
TKDE 2020 | 面向严格冷启动推荐的属性图神经网络
PaperWeekly
13+阅读 · 2020年12月18日
模型攻击:鲁棒性联邦学习研究的最新进展
机器之心
34+阅读 · 2020年6月3日
从 CVPR 2019 一览小样本学习研究进展
AI科技评论
11+阅读 · 2019年7月25日
报名 | 知识图谱前沿技术课程(暨学术交流)
PaperWeekly
17+阅读 · 2017年7月10日
GAN | GAN介绍(2)
KingsGarden
27+阅读 · 2017年3月14日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
2+阅读 · 2022年4月20日
Synthesizing Informative Training Samples with GAN
Arxiv
0+阅读 · 2022年4月15日
Arxiv
12+阅读 · 2022年4月12日
Arxiv
17+阅读 · 2022年1月11日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
小贴士
相关VIP内容
顾及时空特征的地理知识图谱构建方法
专知会员服务
53+阅读 · 2022年2月15日
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
专知会员服务
26+阅读 · 2021年9月4日
专知会员服务
34+阅读 · 2021年8月13日
专知会员服务
64+阅读 · 2021年7月25日
专知会员服务
18+阅读 · 2021年5月16日
专知会员服务
28+阅读 · 2021年2月19日
专知会员服务
48+阅读 · 2020年11月20日
相关资讯
微软亚洲研究院“明日之星”开放岗位
微软研究院AI头条
0+阅读 · 2021年12月21日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
TKDE 2020 | 面向严格冷启动推荐的属性图神经网络
PaperWeekly
13+阅读 · 2020年12月18日
模型攻击:鲁棒性联邦学习研究的最新进展
机器之心
34+阅读 · 2020年6月3日
从 CVPR 2019 一览小样本学习研究进展
AI科技评论
11+阅读 · 2019年7月25日
报名 | 知识图谱前沿技术课程(暨学术交流)
PaperWeekly
17+阅读 · 2017年7月10日
GAN | GAN介绍(2)
KingsGarden
27+阅读 · 2017年3月14日
相关基金
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
2+阅读 · 2022年4月20日
Synthesizing Informative Training Samples with GAN
Arxiv
0+阅读 · 2022年4月15日
Arxiv
12+阅读 · 2022年4月12日
Arxiv
17+阅读 · 2022年1月11日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
微信扫码咨询专知VIP会员