项目名称: 大数据偏好查询算法关键技术研究
项目编号: No.61402130
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 韩希先
作者单位: 哈尔滨工业大学
项目金额: 24万元
中文摘要: 在大数据应用中,如何有效执行偏好查询正在成为一个越来越重要的问题。数据爆炸使得人们很难找到自己真正想要的数据,传统的布尔数据库查询模型在大数据上执行时经常遇到以下问题:空集或过多候选结果。偏好查询通过信息过滤和信息抽取有效减少返回的数据量,帮助用户找到真正有价值的数据,具有较大的学术和实用价值。我们发现,现有的偏好查询算法只适用于中小规模数据,在大数据上会引起较大的执行费用,而且现有关于近似偏好查询的研究工作还很少。为此,本项目主要研究大数据偏好查询算法的关键技术,包括大数据偏好查询的理论基础、准确算法、近似算法和在线算法,拟分析大数据偏好查询的数学抽象和复杂性结果,根据具体偏好查询的特点设计有效的剪切规则来丢弃不属于查询结果的候选元组,在近似偏好查询中考虑误差度和执行行为的关系,从而较好地利用给定误差提供的性能提高空间,并实现大数据偏好查询的原型系统来验证本项目研究成果的正确性和有效性。
中文关键词: 偏好查询;大数据;算法;剪切;有序列表
英文摘要: The efficient handling of preference query in big-data applications is becoming an increasingly important issue nowadays. The data explosion makes it difficult for users to find the data they really want. When performed on big data, traditional Boolean da
英文关键词: preference query;big data;algorithm;pruning operation;sorted list