项目名称: 分布估计学习关键问题研究

项目编号: No.61203305

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 自动化学科

项目作者: 樊建聪

作者单位: 山东科技大学

项目金额: 24万元

中文摘要: 分布估计算法(EDAs)是一种融合了概率密度估计理论和概率模型构建方法的新型演化计算方法,能够用于求解数据学习中的不确定、非线性和动态性等问题。本项目进行基于EDAs的数据学习关键问题研究,主要在EDAs用于分类学习的性能分析与评价、基于EDAs的无结构文本数据的分类学习、EDAs在海量和复杂数据域中的模式学习等三个方面进行研究,主要解决的关键问题包括:(1)EDAs应用于分类学习的有效性理论分析;(2)无结构文本数据集的变元提取及其概率模型的设计与构建问题;(3)基于EDAs的海量数据模式学习算法设计以及海量数据不同模式内与模式间的优化策略设计问题。本项目的研究意义是利用演化学习的概率基础和误差风险估计方法,进行分布估计学习的基础理论分析,实现基于EDAs的海量数据挖掘和文本模式发现,不但可以为复杂的云计算等新型信息技术提供服务,还能够充实和丰富从数据中学习分布模式的理论与方法体系。

中文关键词: 分布估计算法;数据挖掘;机器学习;聚类;

英文摘要: Estimation of distribution algorithms (EDAs) is an outgrowth of evolutionary computation, which is integrated with probability density estimation and probabilistic model-building. EDAs can be used to solve the learning problems with the common characteristics of uncertainty, nonlinear and dynamics of data. The purpose of this project is to research some key problems on learning from data based on EDAs, focusing on the performances analysis and evaluation of classification learning based on EDAs, classification of unstructured text data based on EDAs, pattern learning of massive and complex data domains based on probabilistic model estimation and building. Among the research topics, the key problems that have to be solved include: (1) theoretical analysis in validity and effectiveness of classification learning based on EDAs; (2) variable extraction and its probabilistic models building of unstructured text data sets; (3) design of EDAs-based pattern learning algorithms of massive data sets and optimal strategy analysis in the same pattern or among the different patterns. The significances of the project are to take advantages of probability basis and error estimation theory in evolutionary learning to analyze theoretically estimation of distribution learning, mine massive data sets and discover text patterns bas

英文关键词: Estimation of distribution algorithms;Data mining;Machine learning;Clustering;

成为VIP会员查看完整内容
0

相关内容

【博士论文】开放环境下的度量学习研究
专知会员服务
49+阅读 · 2021年12月4日
专知会员服务
22+阅读 · 2021年9月23日
专知会员服务
17+阅读 · 2021年7月13日
【纽约大学Sean】神经文本退化:一致性和学习,93页ppt
专知会员服务
16+阅读 · 2020年10月18日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
68+阅读 · 2020年9月27日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
L1和L2正则先验分别服从什么分布
七月在线实验室
11+阅读 · 2019年5月8日
如何理解模型的过拟合与欠拟合,以及如何解决?
七月在线实验室
12+阅读 · 2019年4月23日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
从最大似然到EM算法:一致的理解方式
PaperWeekly
18+阅读 · 2018年3月19日
深度学习学习合集
计算机视觉战队
12+阅读 · 2017年12月12日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
24+阅读 · 2021年1月25日
小贴士
相关VIP内容
【博士论文】开放环境下的度量学习研究
专知会员服务
49+阅读 · 2021年12月4日
专知会员服务
22+阅读 · 2021年9月23日
专知会员服务
17+阅读 · 2021年7月13日
【纽约大学Sean】神经文本退化:一致性和学习,93页ppt
专知会员服务
16+阅读 · 2020年10月18日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
68+阅读 · 2020年9月27日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
相关资讯
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
L1和L2正则先验分别服从什么分布
七月在线实验室
11+阅读 · 2019年5月8日
如何理解模型的过拟合与欠拟合,以及如何解决?
七月在线实验室
12+阅读 · 2019年4月23日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
从最大似然到EM算法:一致的理解方式
PaperWeekly
18+阅读 · 2018年3月19日
深度学习学习合集
计算机视觉战队
12+阅读 · 2017年12月12日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员