项目名称: 基于机器学习的多义性数据概念标注研究

项目编号: No.61173068

项目类型: 面上项目

立项/批准年度: 2012

项目学科: 自动化技术、计算机技术

项目作者: 许信顺

作者单位: 山东大学

项目金额: 58万元

中文摘要: 目前,人们得到的数据急剧增长,比如图像、视频和生物信息数据等。为了对这些数据进行有效地管理、挖掘和检索等操作,通常需要先对这些数据在语义(概念)层上进行标注,然后使用与其关联的关键词来进一步操作。而这些数据往往具有多义性的特点,即每个样本同时与多个概念关联。本项目以设计有效的基于机器学习的自动概念标注模型为目标,在充分考虑数据的多义性特点和结构化特征以及在非理想条件下,对标注任务中存在的关键问题和技术进行研究。项目的主要研究内容为:1.研究比较该类数据的结构化表示以及相似性度量方法;2.在数据结构化表示的基础上设计能够同时对数据结构化信息和数据多义性信息建模的概念标注方法;3.研究在有噪声和类别不平衡条件下,针对该数据构建具有较好泛化能力的概念标注模型;4.研究在小规模训练样本条件下充分利用未标注或者标注不充分数据来提高模型的泛化能力。最后,在以上研究的基础上,搭建有效测试平台和原型系统。

中文关键词: 机器学习;多义性数据;概念标注;类别不平衡;

英文摘要:

英文关键词: machine learning;ambiguous data;annotation;class imbalance;

成为VIP会员查看完整内容
4

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
机器学习中原型学习研究进展
专知会员服务
44+阅读 · 2022年1月18日
迁移学习方法在医学图像领域的应用综述
专知会员服务
59+阅读 · 2022年1月6日
贝叶斯迁移学习: 迁移学习的概率图模型概述
专知会员服务
65+阅读 · 2021年10月17日
专知会员服务
84+阅读 · 2021年9月4日
基于深度学习的图异常检测技术综述
专知会员服务
78+阅读 · 2021年7月28日
专知会员服务
24+阅读 · 2021年6月17日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
64+阅读 · 2021年2月7日
专知会员服务
46+阅读 · 2020年10月20日
专知会员服务
31+阅读 · 2020年9月2日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
半监督目标检测相关方法总结
极市平台
3+阅读 · 2022年2月2日
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
自监督视觉特征学习
专知
0+阅读 · 2021年11月1日
最新《多任务学习》综述,39页pdf
专知
26+阅读 · 2020年7月10日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
深度 | 迁移学习全面概述:从基本概念到相关研究
七月在线实验室
15+阅读 · 2017年8月15日
范式大学|迁移学习实战:从算法到实践
机器学习研究会
15+阅读 · 2017年8月9日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
1+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
12+阅读 · 2021年6月29日
小贴士
相关VIP内容
机器学习中原型学习研究进展
专知会员服务
44+阅读 · 2022年1月18日
迁移学习方法在医学图像领域的应用综述
专知会员服务
59+阅读 · 2022年1月6日
贝叶斯迁移学习: 迁移学习的概率图模型概述
专知会员服务
65+阅读 · 2021年10月17日
专知会员服务
84+阅读 · 2021年9月4日
基于深度学习的图异常检测技术综述
专知会员服务
78+阅读 · 2021年7月28日
专知会员服务
24+阅读 · 2021年6月17日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
64+阅读 · 2021年2月7日
专知会员服务
46+阅读 · 2020年10月20日
专知会员服务
31+阅读 · 2020年9月2日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
半监督目标检测相关方法总结
极市平台
3+阅读 · 2022年2月2日
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
自监督视觉特征学习
专知
0+阅读 · 2021年11月1日
最新《多任务学习》综述,39页pdf
专知
26+阅读 · 2020年7月10日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
深度 | 迁移学习全面概述:从基本概念到相关研究
七月在线实验室
15+阅读 · 2017年8月15日
范式大学|迁移学习实战:从算法到实践
机器学习研究会
15+阅读 · 2017年8月9日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员