项目名称: 基于本体的Deep Web搜索技术
项目编号: No.60973040
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 左万利
作者单位: 吉林大学
项目金额: 29万元
中文摘要: 随着Web信息的激增,越来越多的信息开始由静态网页存储的方式向Web服务器维护的数据库即Deep Web转移,与Surface Web相比,Deep Web包含的信息具有更高的质量,同时也是Web上增长速度最快的信息载体,对Deep Web的研究已是Web搜索领域迫在眉睫的任务。 本研究综合应用本体研究Deep Web搜索技术。结合Focused Crawling自动发现Deep Web站点,高效收集Deep Web数据库;准确抽取Deep Web入口表单的属性,获取查询接口的模式信息;设计基于本体的模式匹配算法,指导Deep Web数据库查询接口的模式匹配与融合;研究多数据库入口表单的查询分发与自动填充,实现统一表单接口下多Deep Web数据库的查询;最后以统一的模式将各个Deep Web数据库返回的不同形式查询结果展现给用户。基于上述技术构造某一领域Deep Web搜索的原型系统。
中文关键词: 本体;主题爬行;模式匹配;模式融合;模式集成
英文摘要:
英文关键词: Ontology;Focused Crawling;Schema Matching;Schema Merging;Schema Integrating