项目名称: 基于多源异构不确定数据的高效用信息挖掘的研究

项目编号: No.61503092

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 其他

项目作者: 林浚玮

作者单位: 哈尔滨工业大学

项目金额: 20万元

中文摘要: 由于大数据环境下多源、异构、不确定性、大规模、动态信息资源等特征,如何在复杂的网络环境中挖掘出有用的信息,是目前待解决的重要问题之一。在过去的高效用信息挖掘研究中,主要是处理单一来源、简单型态和确定性数据库,并无法处理大数据环境下的应用。在本项目,我们将创新性地提出 (1) 基于多源、多阶与多维的环境下,提出局部、全局、多层与多维度的四种高效用信息挖掘理论与交换算法。(2) 基于异构环境下,提出泛化、模糊匹配与本体架构的三种高效用信息挖掘理论与融合算法。(3) 基于两种不确定性环境下,分别提出压缩树、链接链表结构与概率-效用列表结构的三种高效用信息挖掘理论与整合算法。本项目的研究除了突破现有研究范围与理论外,并搭建面向多源异构不确定等大数据的高效用信息挖掘验证平台。本项目的研究将对大数据处理问题和高效用信息挖掘的研究产生重大影响,对解决目前大型复杂数据处理与应用等问题起到积极推动作用。

中文关键词: 高效用信息;多源数据;异构数据;不确定数据;大数据

英文摘要: Big Data concern multiple sources, heterogeneous, uncertain, large-scale, growing datasets. It is thus a critical issue to mine useful and meaningful information from the complex big data environment. In the past years, high-utility pattern mining (HUPM) concerns to mine profitable products from one, simple and discriminate database. In this project, we propose three novel frameworks as (1) an exchanged framework with four algorithms to mine high-utility patterns under multiple sources, multiple levels, and multiple dimensions (2) a fusion framework with three algorithms to mine high-utility patterns under heterogeneous environment (3) an integration framework with three algorithms to mine high-utility patterns under two different uncertainty models. We also design a platform and several criteria to evaluate the effectiveness and efficiency of the proposed frameworks. This project can greatly affect the current research of big data mining, especially to mine high-utility patterns from very complex and large scale data sources.

英文关键词: High utility pattern;multi-source data;heterogeneous data;uncertain data;big data

成为VIP会员查看完整内容
3

相关内容

「实体对齐」最新2022综述
专知会员服务
132+阅读 · 2022年3月15日
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
基于表格数据的深度学习方法
专知会员服务
37+阅读 · 2021年10月19日
专知会员服务
44+阅读 · 2021年5月24日
专知会员服务
35+阅读 · 2021年2月20日
专知会员服务
45+阅读 · 2020年11月13日
基于知识图谱的推荐系统研究综述
专知会员服务
328+阅读 · 2020年8月10日
专知会员服务
80+阅读 · 2020年6月20日
「实体对齐」最新2022综述
专知
12+阅读 · 2022年3月17日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
从锚点到关键点:目标检测方法最新进展(2019)
GAN生成式对抗网络
14+阅读 · 2019年8月22日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
Residual Mixture of Experts
Arxiv
0+阅读 · 2022年4月20日
小贴士
相关VIP内容
「实体对齐」最新2022综述
专知会员服务
132+阅读 · 2022年3月15日
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
基于表格数据的深度学习方法
专知会员服务
37+阅读 · 2021年10月19日
专知会员服务
44+阅读 · 2021年5月24日
专知会员服务
35+阅读 · 2021年2月20日
专知会员服务
45+阅读 · 2020年11月13日
基于知识图谱的推荐系统研究综述
专知会员服务
328+阅读 · 2020年8月10日
专知会员服务
80+阅读 · 2020年6月20日
相关资讯
「实体对齐」最新2022综述
专知
12+阅读 · 2022年3月17日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
从锚点到关键点:目标检测方法最新进展(2019)
GAN生成式对抗网络
14+阅读 · 2019年8月22日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
相关基金
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员