项目名称: 基于缺失属性值区间型描述的不完备数据聚类方法及应用研究

项目编号: No.61305034

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 李丹

作者单位: 大连理工大学

项目金额: 25万元

中文摘要: 在自然科学和工程技术的很多领域中,由于获取数据的限制及对数据的理解等因素,信息的不完整问题普遍存在,影响了在此基础上进行的数据分析及理解,为后续的决策分析、过程控制等造成阻碍。因此,不完备数据模糊聚类问题已成为模式识别领域的研究热点之一。针对这一问题,本项目拟围绕如下内容进行研究:(1)充分利用不完备数据集信息,给出缺失属性值的三种区间型描述,将其分析及处理限定在属性空间的合理范围内,以提高其估计的准确度;(2)将缺失属性值的区间型描述也作为聚类因素,研究不完备数据模糊聚类更为有效的求解方案;(3)将所提算法应用于缺损灰度图像的分割问题,并将整体变分模型等图像修复方法融入聚类,实现缺损图像在聚类及图像修复双重优化准则下的分割。本项目的完成将对模式识别领域的不完备数据认知及理解产生积极影响,同时有助于该理论在缺损图像分割等领域的实际应用,具有理论和应用的双重价值。

中文关键词: 模糊聚类;不完备数据;缺失属性值;区间型描述;

英文摘要: In many areas, including natural sciences and engineering technology, many databases are plaugued by the unavoidable problem of data incompleteness due to the imperfect data acquisition, incorrect data comprehension, and other factors.And the missing attribute values make it difficult for analysts to realize data analysis, and would hinder the decision analysis, process control. As a result, the problem of clustering incomplete datasets has become one of the research focuses in the field of pattern recognition. Aiming at this problem, we plan to investigate the following questions: 1) Propose three interval represionation of missing attribute values by using the information of incomplete datasets sufficiently, thus, the analysis and imputation of missing attribute values can be limited to appropriate ranges, and the accuracy can be enhanced; 2) Take the interval representation of missing attribute values as an additional clustering factor, investigate the effective approaches for clustering incomplete data; 3) Apply the proposed approaches to segmentation of gray images with corrupted blocks, and cimbine with the image inpainting approaches such as total variation model, realize the segmentation of images with corrupted blocks by considering both clustering analysis and image inpaiting. The research of the proje

英文关键词: Fuzzy Clustering;Incomplete Data;Missing Attribute Values;Interval Representation;

成为VIP会员查看完整内容
0

相关内容

采用模糊数学语言对事物按一定的要求进行描述和分类的数学方法称为模糊聚类分析。
因果推断在医药图像的应用:数据缺失和数据不匹配
专知会员服务
58+阅读 · 2022年4月2日
面向知识图谱的知识推理综述
专知会员服务
150+阅读 · 2021年11月1日
专知会员服务
145+阅读 · 2021年8月12日
【经典书】机器学习统计学,476页pdf
专知会员服务
122+阅读 · 2021年7月19日
专知会员服务
99+阅读 · 2021年6月23日
专知会员服务
45+阅读 · 2021年5月24日
[CVPR 2020]BEDSR-Net:单张文档图像的阴影去除深度网络
专知会员服务
26+阅读 · 2020年9月29日
专知会员服务
50+阅读 · 2020年8月27日
20个安全可靠的免费数据源,各领域数据任你挑
机器学习算法与Python学习
12+阅读 · 2019年5月9日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
用 LDA 和 LSA 两种方法来降维和做 Topic 建模
AI研习社
13+阅读 · 2018年8月24日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
SkiQL: A Unified Schema Query Language
Arxiv
0+阅读 · 2022年4月19日
Arxiv
1+阅读 · 2022年4月18日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
23+阅读 · 2018年8月3日
小贴士
相关VIP内容
因果推断在医药图像的应用:数据缺失和数据不匹配
专知会员服务
58+阅读 · 2022年4月2日
面向知识图谱的知识推理综述
专知会员服务
150+阅读 · 2021年11月1日
专知会员服务
145+阅读 · 2021年8月12日
【经典书】机器学习统计学,476页pdf
专知会员服务
122+阅读 · 2021年7月19日
专知会员服务
99+阅读 · 2021年6月23日
专知会员服务
45+阅读 · 2021年5月24日
[CVPR 2020]BEDSR-Net:单张文档图像的阴影去除深度网络
专知会员服务
26+阅读 · 2020年9月29日
专知会员服务
50+阅读 · 2020年8月27日
相关资讯
20个安全可靠的免费数据源,各领域数据任你挑
机器学习算法与Python学习
12+阅读 · 2019年5月9日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
用 LDA 和 LSA 两种方法来降维和做 Topic 建模
AI研习社
13+阅读 · 2018年8月24日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员