项目名称: 基于神经网络的跨语言实体链指研究

项目编号: No.61502035

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 计算机科学学科

项目作者: 郭宇航

作者单位: 北京理工大学

项目金额: 21万元

中文摘要: 跨语言实体链指技术将一种语言的上下文中的名称链接到另一种语言知识库的相应实体上。这种技术打破知识的语言鸿沟,一方面能够最大程度地利用互联网上由不同语言表示的知识库,另一方面也能为缺乏知识库的语言的信息处理提供支持。跨语言实体链指的难点在于如何计算由不同语言表示的文本之间的相似度。本项目深入研究基于神经网络的上下文语义表示方法。通过基于词向量的翻译技术,缓解未登录词对跨语言文本相似度的影响;通过基于段落向量的翻译技术,利用上下文中的全局信息计算跨语言文本之间的相似度;通过将不同语言映射到同一个段落向量空间,实现不经过翻译直接计算跨语言文本相似度的方法,从而减少翻译步骤带来的错误级联。

中文关键词: 实体链指;跨语言;神经网络;词向量;段落向量

英文摘要: Cross-lingual entity linking is a technique which links a name presented in one language to the referent entity in the knowledge based described in another language. This technique can break the language gap in knowledge. On one hand, it can leverage knowledge bases in different languages in the Internet. On the other hand, it can provide information processing supports for the languages which are lack of knowledge bases. The difficult of cross-lingual entity linking is how to compute the similarity between texts which are represented in different languages. This project investigates the context semantic representation based on neural network. Through word vector based translation technique, we can alleviate the affect from out-of-vocabulary words. Through paragraph vector based translation, we can use the global information in the context to calculate the similarity between cross-lingual texts. Through mapping different language into a paragraph vector space, we can calculate cross-lingual text similarity without the translation, which results in less cascading errors from the translation step.

英文关键词: Entity Linking;Cross-Lingual;Neural Network;Word Vector;Paragraph Vector

成为VIP会员查看完整内容
4

相关内容

知识图谱嵌入技术研究综述
专知会员服务
133+阅读 · 2022年2月5日
开放领域知识图谱问答研究综述
专知会员服务
61+阅读 · 2021年10月30日
专知会员服务
86+阅读 · 2021年9月4日
专知会员服务
20+阅读 · 2021年7月19日
【CCL2020】基于深度学习的实体关系抽取研究综述
专知会员服务
52+阅读 · 2020年11月4日
最新《图神经网络知识图谱补全》综述论文
专知会员服务
155+阅读 · 2020年7月29日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
论文浅尝 | 利用 KG Embedding 进行问题回答
开放知识图谱
22+阅读 · 2019年7月7日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
综述 | 知识图谱发展概述
PaperWeekly
75+阅读 · 2017年11月3日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
Arxiv
25+阅读 · 2022年1月3日
Hierarchical Graph Capsule Network
Arxiv
20+阅读 · 2020年12月16日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Arxiv
24+阅读 · 2018年10月24日
小贴士
相关VIP内容
知识图谱嵌入技术研究综述
专知会员服务
133+阅读 · 2022年2月5日
开放领域知识图谱问答研究综述
专知会员服务
61+阅读 · 2021年10月30日
专知会员服务
86+阅读 · 2021年9月4日
专知会员服务
20+阅读 · 2021年7月19日
【CCL2020】基于深度学习的实体关系抽取研究综述
专知会员服务
52+阅读 · 2020年11月4日
最新《图神经网络知识图谱补全》综述论文
专知会员服务
155+阅读 · 2020年7月29日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
相关资讯
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
论文浅尝 | 利用 KG Embedding 进行问题回答
开放知识图谱
22+阅读 · 2019年7月7日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
综述 | 知识图谱发展概述
PaperWeekly
75+阅读 · 2017年11月3日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员