组中选优机器学习问题建模和算法研究 - 专知基金

会员服务 ·

0

组中选优 · 支持向量机 · 最小序贯算法 ·

2012 年 12 月 31 日

组中选优机器学习问题建模和算法研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 组中选优机器学习问题建模和算法研究

项目编号： No.61271337

项目类型： 面上项目

立项/批准年度： 2013

项目学科： 无线电电子学、电信技术

项目作者： 罗林开

作者单位： 厦门大学

项目金额： 72万元

中文摘要： 组中选优是机器学习尚待研究具有挑战性的新问题，具有常规机器学习所没有的新特点。本项目针对组间同类样本之间的比较带来负面影响的问题，研究降低其影响的数据预处理方法，以及在建模中对组间同类样本不进行比较的嵌入方法；在此基础上，设计体现分组特点的泛化性能定量指标，建立具有强泛化性能和组内非线性可分处理能力的组中选优机器学习新模型；并针对最优样本与非最优样本数量极度不平衡问题，研究不使用类权重的处理方法；分析新模型的性质，给出大规模问题时的高效算法；结合工艺参数寻优和投资优化等领域的组中选优问题，开展新模型、新算法的应用研究。组中选优作为一个新的基础性机器学习问题，本项目的研究可以丰富现有机器学习的模型和算法，拓广现有机器学习的应用范围，既有很强的创新性，亦有重要的应用价值。

中文关键词： 组中选优；支持向量机；最小序贯算法；；

英文摘要： Learning the rule of selecting the best one from group data (SBG) is a new machine learning problem. It brings some challenges for the existing machine learning models because of the new characteristics. To eliminate the negative impact on the comparison of the samples with same type between groups, this project first investigates the data preprocessing method,as well as the embedding methods in modeling without taking the comparison. Then, the quantitative measure of generalization performance for SBG is proposed. And some new models for the SBG learning problem are developed, in which a strong generalization performance and a good suitability for nonlinear separable problem within-group are guaranteed. Thirdly,to overcome the extremely unbalanced problem between the sizes of two classes, some methods without utilizing the weights of classes are investigated. Fourthly, the efficient algorithm for the new models with large scale data is presented after investigating the nature of the models. Finally, two applications on the optimizations of process parameters and investment are provided. SBG is a new foundation machine learning problem, this project will extend the models, algorithms and application ranges of the existing machine learning techinique,which is innovation in theory and has great application value.

英文关键词： Selecting the best in each group；SVM；SMO；；

成为VIP会员查看完整内容

2

相关内容

组中选优

数据与机器学习，人工智能报告

数据与机器学习，人工智能报告

专知会员服务

100+阅读 · 2022年2月21日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知会员服务

30+阅读 · 2021年12月3日

机器学习技术在材料科学领域中的应用进展

专知会员服务

43+阅读 · 2021年9月7日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

【经典书】数据科学:理论、模型、算法和分析，462页pdf

专知会员服务

65+阅读 · 2021年4月6日

923页ppt！经典课《机器学习核方法》，附视频

923页ppt！经典课《机器学习核方法》，附视频

专知会员服务

105+阅读 · 2021年3月1日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

经济学中的数据科学：机器学习与深度学习方法

经济学中的数据科学：机器学习与深度学习方法

专知会员服务

27+阅读 · 2020年10月19日

机器学习的可解释性

机器学习的可解释性

专知会员服务

178+阅读 · 2020年8月27日

低秩稀疏矩阵优化问题的模型与算法

专知会员服务

46+阅读 · 2020年7月29日

2022最新《数据与机器学习，人工智能报告》

2022最新《数据与机器学习，人工智能报告》

专知

11+阅读 · 2022年2月21日

一文解决样本不均衡（全）

一文解决样本不均衡（全）

极市平台

6+阅读 · 2022年1月9日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知

0+阅读 · 2021年12月3日

机器学习中四种调参方法总结

机器学习中四种调参方法总结

极市平台

1+阅读 · 2021年10月19日

「我」做算法工作的小反思！

「我」做算法工作的小反思！

机器学习与推荐算法

0+阅读 · 2021年9月14日

【PHM算法】PHM算法 | 故障诊断建模方法

【PHM算法】PHM算法 | 故障诊断建模方法

产业智能官

67+阅读 · 2020年3月16日

【机器学习】一文读懂线性回归、岭回归和Lasso回归

【机器学习】一文读懂线性回归、岭回归和Lasso回归

AINLP

20+阅读 · 2019年10月12日

如何理解模型的过拟合与欠拟合，以及如何解决？

如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

12+阅读 · 2019年4月23日

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

迁移学习在深度学习中的应用

迁移学习在深度学习中的应用

专知

24+阅读 · 2017年12月24日

高维不平衡数据的集成学习算法研究

国家自然科学基金

15+阅读 · 2015年12月31日

基于参数的迁移学习分析、建模与应用

国家自然科学基金

6+阅读 · 2014年12月31日

多任务学习的理论分析与应用

国家自然科学基金

6+阅读 · 2013年12月31日

稀疏支持向量机的理论、算法及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

低秩张量优化问题的模型、算法及应用

国家自然科学基金

5+阅读 · 2013年12月31日

结合先进机器学习方法的代理模型进化算法研究

国家自然科学基金

4+阅读 · 2013年12月31日

半参数混合密度模型的理论及应用

国家自然科学基金

0+阅读 · 2013年12月31日

面向文本分类的多学科协同建模理论与实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向半监督数据集的智能软测量建模方法研究与应用

国家自然科学基金

1+阅读 · 2012年12月31日

机器学习核方法模型选择与组合的核矩阵近似分析方法

国家自然科学基金

0+阅读 · 2011年12月31日

Quantum Bayesian Statistical Inference

Arxiv

1+阅读 · 2022年4月19日

EXIT: Extrapolation and Interpolation-based Neural Controlled Differential Equations for Time-series Classification and Forecasting

Arxiv

0+阅读 · 2022年4月19日

Growing Urban Bicycle Networks

Arxiv

0+阅读 · 2022年4月17日

Analytical Benchmark Problems for Multifidelity Optimization Methods

Arxiv

0+阅读 · 2022年4月16日

PAC-Bayesian Based Adaptation for Regularized Learning

Arxiv

1+阅读 · 2022年4月16日

GCR: Gradient Coreset Based Replay Buffer Selection For Continual Learning

Arxiv

0+阅读 · 2022年4月15日

Tighter Theory for Local SGD on Identical and Heterogeneous Data

Arxiv

0+阅读 · 2022年4月14日

Convergence and Implicit Regularization Properties of Gradient Descent for Deep Residual Networks

Arxiv

0+阅读 · 2022年4月14日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

17+阅读 · 2019年10月30日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

支持向量机

最小序贯算法

热门VIP内容

开通专知VIP会员享更多权益服务

检索增强生成（RAG）技术，261页slides

美联参会指南-联合规划与执行概述及政策框架 | 32页

从DeepSeek-R1学到的三个核心经验

大规模视觉模型中的提示式适配：综述

相关VIP内容

数据与机器学习，人工智能报告

数据与机器学习，人工智能报告

专知会员服务

100+阅读 · 2022年2月21日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知会员服务

30+阅读 · 2021年12月3日

机器学习技术在材料科学领域中的应用进展

专知会员服务

43+阅读 · 2021年9月7日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

【经典书】数据科学:理论、模型、算法和分析，462页pdf

专知会员服务

65+阅读 · 2021年4月6日

923页ppt！经典课《机器学习核方法》，附视频

923页ppt！经典课《机器学习核方法》，附视频

专知会员服务

105+阅读 · 2021年3月1日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

经济学中的数据科学：机器学习与深度学习方法

经济学中的数据科学：机器学习与深度学习方法

专知会员服务

27+阅读 · 2020年10月19日

机器学习的可解释性

机器学习的可解释性

专知会员服务

178+阅读 · 2020年8月27日

低秩稀疏矩阵优化问题的模型与算法

专知会员服务

46+阅读 · 2020年7月29日

相关资讯

2022最新《数据与机器学习，人工智能报告》

2022最新《数据与机器学习，人工智能报告》

专知

11+阅读 · 2022年2月21日

一文解决样本不均衡（全）

一文解决样本不均衡（全）

极市平台

6+阅读 · 2022年1月9日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知

0+阅读 · 2021年12月3日

机器学习中四种调参方法总结

机器学习中四种调参方法总结

极市平台

1+阅读 · 2021年10月19日

「我」做算法工作的小反思！

「我」做算法工作的小反思！

机器学习与推荐算法

0+阅读 · 2021年9月14日

【PHM算法】PHM算法 | 故障诊断建模方法

【PHM算法】PHM算法 | 故障诊断建模方法

产业智能官

67+阅读 · 2020年3月16日

【机器学习】一文读懂线性回归、岭回归和Lasso回归

【机器学习】一文读懂线性回归、岭回归和Lasso回归

AINLP

20+阅读 · 2019年10月12日

如何理解模型的过拟合与欠拟合，以及如何解决？

如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

12+阅读 · 2019年4月23日

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

迁移学习在深度学习中的应用

迁移学习在深度学习中的应用

专知

24+阅读 · 2017年12月24日

相关基金

高维不平衡数据的集成学习算法研究

国家自然科学基金

15+阅读 · 2015年12月31日

基于参数的迁移学习分析、建模与应用

国家自然科学基金

6+阅读 · 2014年12月31日

多任务学习的理论分析与应用

国家自然科学基金

6+阅读 · 2013年12月31日

稀疏支持向量机的理论、算法及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

低秩张量优化问题的模型、算法及应用

国家自然科学基金

5+阅读 · 2013年12月31日

结合先进机器学习方法的代理模型进化算法研究

国家自然科学基金

4+阅读 · 2013年12月31日

半参数混合密度模型的理论及应用

国家自然科学基金

0+阅读 · 2013年12月31日

面向文本分类的多学科协同建模理论与实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向半监督数据集的智能软测量建模方法研究与应用

国家自然科学基金

1+阅读 · 2012年12月31日

机器学习核方法模型选择与组合的核矩阵近似分析方法

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

Quantum Bayesian Statistical Inference

Arxiv

1+阅读 · 2022年4月19日

EXIT: Extrapolation and Interpolation-based Neural Controlled Differential Equations for Time-series Classification and Forecasting

Arxiv

0+阅读 · 2022年4月19日

Growing Urban Bicycle Networks

Arxiv

0+阅读 · 2022年4月17日

Analytical Benchmark Problems for Multifidelity Optimization Methods

Arxiv

0+阅读 · 2022年4月16日

PAC-Bayesian Based Adaptation for Regularized Learning

Arxiv

1+阅读 · 2022年4月16日

GCR: Gradient Coreset Based Replay Buffer Selection For Continual Learning

Arxiv

0+阅读 · 2022年4月15日

Tighter Theory for Local SGD on Identical and Heterogeneous Data

Arxiv

0+阅读 · 2022年4月14日

Convergence and Implicit Regularization Properties of Gradient Descent for Deep Residual Networks

Arxiv

0+阅读 · 2022年4月14日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

17+阅读 · 2019年10月30日

Dynamic Graph Representation Learning via Self-Attention Networks

Arxiv

52+阅读 · 2019年6月15日

微信扫码咨询专知VIP会员