项目名称: 面向过时信息自动发现的Web时态一致性研究

项目编号: No.61272109

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 李石君

作者单位: 武汉大学

项目金额: 80万元

中文摘要: Web包含过时信息是一个普遍现象,严重影响了Web信息质量。目前解决这一问题主要采用人工排查,还没有形成系统的理论,迫切需要自动发现Web过时信息的理论和方法。从这一现象可提炼出科学问题"保持Web时态一致性",其挑战是时态信息的语义理解与抽取,以及时态信息的复杂约束关系。本项目研究在Web内容要素中加入时态要素的Web时态对象模型,对站点、栏目、子栏目与页面的内容和时态采用层次树统一建模;研究利用时态特征词对各时态要素的自动提取及评估方法;研究Web时态对象模型中栏目、子栏目与页面为保持时态一致性须遵循的复杂约束关系,以及由其中已知时态信息推断未知时态信息的推理机制和代数系统。从而建立Web时态一致性理论体系,提出自动发现Web过时信息的方法和工具,将在网站过时网页自动发现与排序、同类网站质量排序、时间感知的搜索排序等方面有着重要的应用前景,能极大地节约人力,提高Web信息质量。

中文关键词: 时态Web;时态一致性;Web数据质量;过时信息发现;不一致检测

英文摘要: The prevalence that the web contains outdated information is one of the main reasons for the crappy web information quality. The solution for this problem is artificial both domestic and overseas for the present, while the systematic theory hasn't been formed. Therefore it is in desperate need for the theory and methodology to automatically discover the outdated information. The scientific issue of this phenomenon is how to keep the web temporal consistency, which challenges to semantic comprehension and extraction of the temporal information as well as complex constraint relation in it. As a result, this project will focus on these items: the web temporal object model which adds the temporal factor into the web content element; a unified tree model to build based on the content and temporal of the website, column, sub column and the pages; the automatic extraction and assessment approach of the temporal factors using the temporal features; the complex constraint relation observed for temporal consistency of the column, sub column and the pages in the temporal object model; as well as the reasoning mechanism and algebraic system for given information to unknown information. We will build a web temporal consistency theory system to present the methodology and implement to discover the outdated web information aut

英文关键词: Temporal Web;Temporal Consistency;Web data quality;Outdated information;Inconsistent detection

成为VIP会员查看完整内容
0

相关内容

专知会员服务
12+阅读 · 2021年9月21日
专知会员服务
34+阅读 · 2021年9月5日
专知会员服务
122+阅读 · 2021年6月12日
专知会员服务
29+阅读 · 2021年6月4日
【AAAI2021】以事件为中心的自然语言理解,256页ppt
专知会员服务
72+阅读 · 2021年2月8日
【WSDM2021】基于演化状态图的时间序列事件预测
专知会员服务
50+阅读 · 2020年12月1日
【ACM MM2020】跨模态分布匹配的半监督多模态情感识别
专知会员服务
42+阅读 · 2020年9月8日
手机的负一屏有用吗?
ZEALER订阅号
0+阅读 · 2021年11月14日
TKDE'21 | 异质图神经网络如何自动发现元路径?
图与推荐
1+阅读 · 2021年10月18日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
技术动态 | 知识图谱上的实体链接
开放知识图谱
69+阅读 · 2019年9月8日
SemanticAdv:基于语义属性的对抗样本生成方法
机器之心
14+阅读 · 2019年7月12日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
13+阅读 · 2018年4月18日
小贴士
相关VIP内容
专知会员服务
12+阅读 · 2021年9月21日
专知会员服务
34+阅读 · 2021年9月5日
专知会员服务
122+阅读 · 2021年6月12日
专知会员服务
29+阅读 · 2021年6月4日
【AAAI2021】以事件为中心的自然语言理解,256页ppt
专知会员服务
72+阅读 · 2021年2月8日
【WSDM2021】基于演化状态图的时间序列事件预测
专知会员服务
50+阅读 · 2020年12月1日
【ACM MM2020】跨模态分布匹配的半监督多模态情感识别
专知会员服务
42+阅读 · 2020年9月8日
相关资讯
手机的负一屏有用吗?
ZEALER订阅号
0+阅读 · 2021年11月14日
TKDE'21 | 异质图神经网络如何自动发现元路径?
图与推荐
1+阅读 · 2021年10月18日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
技术动态 | 知识图谱上的实体链接
开放知识图谱
69+阅读 · 2019年9月8日
SemanticAdv:基于语义属性的对抗样本生成方法
机器之心
14+阅读 · 2019年7月12日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
相关基金
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员