项目名称: 基于用户反馈的Web数据集成中的数据质量管理
项目编号: No.61173146
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 计算机科学学科
项目作者: 万常选
作者单位: 江西财经大学
项目金额: 57万元
中文摘要: Web数据集成由于其特殊性,给数据质量管理带来了新的挑战和机遇。本项目研究Web数据集成中的若干数据质量管理问题,包括:Web数据源选择;Web数据集成中的实体关联,包括离线实体关联、在线实体关联和实体关联更新;数据融合。总体思路是,将用户反馈作为出发点和突破口,根据Web数据源和Web数据集成的特点,基于用户反馈学习解决方案。该思路利用了Web数据集成的特点,探索了数据质量管理的新方法。具体来说,基于数据源质量和用户反馈来选择Web数据源;以用户反馈为指导,利用Web语境和隐式关系进行离线实体关联,基于用户反馈和查询松弛进行在线实体关联,通过Web页面更新识别实现实体关联更新;通过属性分类和属性可信度计算实现数据融合。项目提出的基于用户反馈的数据源选择方法、基于用户反馈的实体关联方法和基于群体的实体关联方法具有创新性。
中文关键词: Web数据集成;数据源选择;实体关系抽取;XML检索质量;情感分析
英文摘要:
英文关键词: Web data integration;data sources selection;entity relationship extraction;XML retrieval quality;sentiment analysis