项目名称: 基于域知识的自定义Web对象自动抽取技术

项目编号: No.61363005

项目类型: 地区科学基金项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 张敬伟

作者单位: 桂林电子科技大学

项目金额: 47万元

中文摘要: Web包含海量的对象描述数据,其具有巨大应用价值,让这些数据易于管理和使用对不同数据需求的用户具有重要意义。Web数据抽取技术负责将Web对象数据从复杂的Web页面中分离出来,但现有的Web数据抽取技术多采用结构导向的抽取策略,不支持目标对象定义接口,不能满足用户的个性化需求,而且对大规模抽取缺乏性能优化设计。本项目针对上述需求与挑战,系统研究基于正则树的对象定义技术,引入标签概率等价类设计基于域知识的高准确度Web页面语义标注和训练集自动构建方法,探索语义导向的归纳逻辑和主动学习融合的抽取规则生成技术,让Web 对象抽取在抽取自动化和用户满意度上取得双重受益。同时,基于研究的成果建立原型系统,执行大规模实验验证方法的有效性和可扩展性,结合充分的理论分析,设计性能优化模型。本项目以用户需求为出发点,有助于充分开采Web数据的价值,拓展抽取技术的应用范畴,具有重要的理论意义和应用价值。

中文关键词: 自定义对象抽取;海量数据管理;多特征决策抽取;;

英文摘要: Web contains massive object data, which have huge value for Web applications, it is very significant for users with different requirements to manage and use these data easily. Web data extraction technologies are responsible for separating Web object data

英文关键词: customized object extraction;massive data management;extraction on multi-feature decision;;

成为VIP会员查看完整内容
0

相关内容

军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
UIUC韩家炜:从海量非结构化文本中挖掘结构化知识
专知会员服务
96+阅读 · 2021年12月30日
专知会员服务
15+阅读 · 2021年8月19日
专知会员服务
79+阅读 · 2021年7月3日
专知会员服务
79+阅读 · 2021年5月27日
专知会员服务
20+阅读 · 2021年4月15日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
专知会员服务
195+阅读 · 2020年10月14日
专知会员服务
33+阅读 · 2020年9月25日
面向云原生应用的低代码开发平台构建之路
AI前线
0+阅读 · 2022年1月26日
云孚知识图谱YFKG:可自动扩充的知识图谱
哈工大SCIR
4+阅读 · 2021年4月23日
【WWW2021】实体自适应语义依赖图立场检测
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
论文浅尝 | 基于知识库的自然语言理解 03#
开放知识图谱
14+阅读 · 2019年2月26日
【知识图谱】 一个有效的知识图谱是如何构建的?
产业智能官
57+阅读 · 2018年4月5日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
15+阅读 · 2021年11月19日
Arxiv
24+阅读 · 2021年1月25日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
小贴士
相关VIP内容
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
UIUC韩家炜:从海量非结构化文本中挖掘结构化知识
专知会员服务
96+阅读 · 2021年12月30日
专知会员服务
15+阅读 · 2021年8月19日
专知会员服务
79+阅读 · 2021年7月3日
专知会员服务
79+阅读 · 2021年5月27日
专知会员服务
20+阅读 · 2021年4月15日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
专知会员服务
195+阅读 · 2020年10月14日
专知会员服务
33+阅读 · 2020年9月25日
相关资讯
面向云原生应用的低代码开发平台构建之路
AI前线
0+阅读 · 2022年1月26日
云孚知识图谱YFKG:可自动扩充的知识图谱
哈工大SCIR
4+阅读 · 2021年4月23日
【WWW2021】实体自适应语义依赖图立场检测
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
论文浅尝 | 基于知识库的自然语言理解 03#
开放知识图谱
14+阅读 · 2019年2月26日
【知识图谱】 一个有效的知识图谱是如何构建的?
产业智能官
57+阅读 · 2018年4月5日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员