项目名称: 基于语义距离的分布式数据挖掘理论与方法

项目编号: No.71271076

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 管理科学

项目作者: 刘滨

作者单位: 河北科技大学

项目金额: 55万元

中文摘要: 以电子商务个性化推荐、销售预测问题为工程背景和应用面向,围绕分布式数据挖掘(DDM)模型的构建和求解问题,从消除语义分割式独立挖掘的质量隐患入手,综合多种本体匹配策略,建立从局部到整体度量数据源间语义距离的复合量化体系,提炼出数据源间的语义本质差异,据之建立数据源分组的层次化挖掘体系;进而研究层次式筛检结果的质量考察方法和知识整合模型、以层为资源单位的负载平衡机制;继而从结构化的角度构建具有可操作性的、侧重质量兼顾效率的层次化DDM模型。针对模型求解,设计多算法(神经网络、遗传算法等)集成的智能计算方法,构建Web服务库和Agent主导的服务组合模型;并基于JAFMAS框架设计多Agent工作机制;建立强化语义理解挖掘过程和结果的、能提高用户参与度的人机交互机制。最后,结合具体案例验证模型和算法的有效性。本研究将丰富和完善DDM理论和方法,在电子商务个性化推荐、销售预测等领域应用前景广泛。

中文关键词: 语义距离;本体;数据挖掘;数据可视化;

英文摘要: In this project, personalized recommendation and sales forecasting in e-commerce are considered as the engineering background and oriented application. Around the issues in the construction and solution of distributed data mining (DDM) model, this research starts with the motivation of eliminating quality risks produced by independent mining in a semantic segmentation way. We will utilize multi-strategy ontology matching to build a compound quantization architecture for measuring the semantic distance from local to the whole between data source ontologies. With the architecture, the essential semantic difference between data sources can be found, and the hierarchical data mining architecture will be set up sequentially. Secondly, we will develop the quality inspection method for hierarchically filtering the intermediate results, knowledge integration model, and load balancing mechanisms based on layer-unit. Then, from a structural point of view, a workable hierarchical DDM model will be proposed, which focuses on the quality as well as the efficiency. To provide a solution of the DDM model, the intelligent computing method which can integrate multiple algorithms (neural network,genetic algorithm, etc.) will be designed; the web service library and agent-oriented service composition model will be built sequentia

英文关键词: semantic distance;ontology;data mining;data visualizaiton;

成为VIP会员查看完整内容
0

相关内容

军事知识图谱构建技术
专知会员服务
113+阅读 · 2022年4月8日
自然语言处理中的文本表示研究
专知会员服务
55+阅读 · 2022年1月10日
ACM TOIS 2021 | 第一个基于多关系图的任务驱动GNN框架
专知会员服务
16+阅读 · 2021年10月25日
专知会员服务
33+阅读 · 2021年10月17日
专知会员服务
67+阅读 · 2021年10月10日
专知会员服务
27+阅读 · 2021年2月17日
【AAAI2021】基于图神经网络的文本语义匹配算法
专知会员服务
47+阅读 · 2021年1月30日
专知会员服务
44+阅读 · 2020年8月20日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
Embedding技术在商业搜索与推荐场景的实践
机器学习与推荐算法
0+阅读 · 2022年2月15日
自然语言处理中的文本表示研究
专知
0+阅读 · 2022年1月10日
TOIS'21 | 第一个基于多关系图的任务驱动GNN框架
图与推荐
0+阅读 · 2021年10月26日
本体:一文读懂领域本体构建
AINLP
37+阅读 · 2019年2月27日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
一种基于序列标注的MOOC知识点抽取方法
科技创新与创业
15+阅读 · 2017年11月10日
关系推理:基于表示学习和语义要素
计算机研究与发展
18+阅读 · 2017年8月22日
基于LDA的主题模型实践(二 )MCMC--吉布斯采样
机器学习深度学习实战原创交流
24+阅读 · 2015年9月17日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月17日
A Survey on Bayesian Deep Learning
Arxiv
60+阅读 · 2020年7月2日
小贴士
相关VIP内容
军事知识图谱构建技术
专知会员服务
113+阅读 · 2022年4月8日
自然语言处理中的文本表示研究
专知会员服务
55+阅读 · 2022年1月10日
ACM TOIS 2021 | 第一个基于多关系图的任务驱动GNN框架
专知会员服务
16+阅读 · 2021年10月25日
专知会员服务
33+阅读 · 2021年10月17日
专知会员服务
67+阅读 · 2021年10月10日
专知会员服务
27+阅读 · 2021年2月17日
【AAAI2021】基于图神经网络的文本语义匹配算法
专知会员服务
47+阅读 · 2021年1月30日
专知会员服务
44+阅读 · 2020年8月20日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
相关资讯
Embedding技术在商业搜索与推荐场景的实践
机器学习与推荐算法
0+阅读 · 2022年2月15日
自然语言处理中的文本表示研究
专知
0+阅读 · 2022年1月10日
TOIS'21 | 第一个基于多关系图的任务驱动GNN框架
图与推荐
0+阅读 · 2021年10月26日
本体:一文读懂领域本体构建
AINLP
37+阅读 · 2019年2月27日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
一种基于序列标注的MOOC知识点抽取方法
科技创新与创业
15+阅读 · 2017年11月10日
关系推理:基于表示学习和语义要素
计算机研究与发展
18+阅读 · 2017年8月22日
基于LDA的主题模型实践(二 )MCMC--吉布斯采样
机器学习深度学习实战原创交流
24+阅读 · 2015年9月17日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员