项目名称: 大型语义辞典的自动生成及在文本分析中的应用
项目编号: No.61370054
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 张岩
作者单位: 北京大学
项目金额: 78万元
中文摘要: WordNet、CCD等语义辞典作为自然语言处理的基础工具,被广泛地应用于文本分析、机器翻译等领域。然而,随着Web2.0的到来,各种新的词汇,特别是网络新词日新月异,使得传统的、专家编辑的语义辞典已经跟不上时代的步伐。本项目将研究如何对多个在线百科进行整合,从中提取出活跃的新词,添加到传统的语义辞典中,形成一个全新的、词汇覆盖率更大的语义辞典。这样一方面可提高用户使用语义辞典进行文本分析等应用时的使用效果,同时在专家对语义辞典进行丰富完善时,能够给予一定的帮助,提高精度和效率。除了提出一套通用方法和生成相应的增强版语义辞典外,本项目还考虑如何提炼语义辞典中词汇之间的语义关系,更好地应用于文本分析和机器翻译等任务中。
中文关键词: 语义辞典;在线百科;文本分析;知识图谱;
英文摘要: As a basic tool in natural language processing, semantic lexicons such as WordNet and CCD have widely used in text analysis, machine translation, and other fields. However, along with Web 2.0, various of new words come forth every day. Hence the tradition
英文关键词: semantic lexicon;online encyclopedia;text analysis;knowledge graph;