项目名称: 基于Wiki资源的中英文跨语言本体知识库构建

项目编号: No.61202246

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 王志春

作者单位: 北京师范大学

项目金额: 24万元

中文摘要: 随着互联网的快速发展,原来由英文信息占主导地位的Web已经发展成为全球化、多语言的信息空间。多语言的Web环境为语义信息交互与共享带来了新的挑战。构建大规模的跨语言本体知识库对于实现计算机跨语言信息的自动处理有着十分重要的作用。现有的跨语言知识库存在不同语言之间实例数量不平衡、跨语言链接少和中文结构化信息贫乏的缺点。针对这些问题,本课题以基于Wiki资源构建中英文跨语言本体知识库为目标,拟从四个方面展开研究:(1)异构中文Wiki资源的匹配与合并;(2)中英文Wiki资源的跨语言链接发现;(3)中英文跨语言本体自动构建;(4)面向Wiki资源的跨语言结构化信息抽取。基于上述研究获得的中英文跨语言本体知识库,可为中英文跨语言信息共享与处理提供有效支持。

中文关键词: 跨语言链接;知识库;本体;;

英文摘要: With the rapid development of Internet,the Web has evolved into a glabal multilingual information space. The multilingual nature of Web poses new challenges for semantic information interaction and sharing. Building large-scale crosslingual ontology knowledge bases is crucial for automaticly crosslingual information processing by computers. Existing crosslingual knowledge bases suffer some problems, including imbalanced number of instances among different languages, small number of crosslingual links, and insufficient Chinese stractural information.To solve these problems, this project aims to build large scale Chinese-English crosslingual ontology knowledge base from Wiki resources.Specifically, four topics are to be investigated in this project: (1) heterogeneous Chinese Wiki resources matching and alignment; (2) crosslingual links discovering across the Wiki resources; (3) crosslingaul ontology construction; (4) crosslingual information extraction from Wiki resources. Based on the above research topics, a large scale Chinese-English crosslingual knowledge base can be built, which may greatly benifit corsslingual information proccessing applications.

英文关键词: Cross-lingual linking;Knowledge base;Ontology;;

成为VIP会员查看完整内容
1

相关内容

知识库(Knowledge Base)是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算 机存储器中 存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定 理和运算法则以及常识性知识等。
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
EMNLP 2021 | 预训练跨语言模型中的大词表构建及使用
专知会员服务
20+阅读 · 2022年1月5日
专知会员服务
87+阅读 · 2021年9月4日
【北京大学冯岩松】基于知识的自然语言问答
专知会员服务
44+阅读 · 2020年11月15日
专知会员服务
195+阅读 · 2020年10月14日
专知会员服务
28+阅读 · 2020年10月9日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐
哈工大SCIR
0+阅读 · 2022年3月11日
论文浅尝 | 基于知识库的自然语言理解 03#
开放知识图谱
14+阅读 · 2019年2月26日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
中文NLP福利!大规模中文自然语言处理语料
新智元
37+阅读 · 2019年2月13日
资源 | Python 中文书籍大集合
AI研习社
13+阅读 · 2018年12月20日
徐阿衡 | 知识抽取-实体及关系抽取(一)
开放知识图谱
41+阅读 · 2018年9月18日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
【推荐】中文通用知识图谱(CN-DBpedia)
机器学习研究会
31+阅读 · 2017年9月15日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
29+阅读 · 2020年3月16日
Arxiv
27+阅读 · 2018年4月12日
Arxiv
11+阅读 · 2018年1月11日
小贴士
相关主题
相关VIP内容
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
EMNLP 2021 | 预训练跨语言模型中的大词表构建及使用
专知会员服务
20+阅读 · 2022年1月5日
专知会员服务
87+阅读 · 2021年9月4日
【北京大学冯岩松】基于知识的自然语言问答
专知会员服务
44+阅读 · 2020年11月15日
专知会员服务
195+阅读 · 2020年10月14日
专知会员服务
28+阅读 · 2020年10月9日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
相关资讯
赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐
哈工大SCIR
0+阅读 · 2022年3月11日
论文浅尝 | 基于知识库的自然语言理解 03#
开放知识图谱
14+阅读 · 2019年2月26日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
中文NLP福利!大规模中文自然语言处理语料
新智元
37+阅读 · 2019年2月13日
资源 | Python 中文书籍大集合
AI研习社
13+阅读 · 2018年12月20日
徐阿衡 | 知识抽取-实体及关系抽取(一)
开放知识图谱
41+阅读 · 2018年9月18日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
【推荐】中文通用知识图谱(CN-DBpedia)
机器学习研究会
31+阅读 · 2017年9月15日
相关基金
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员