项目名称: 基于FrameNet的中文评价词汇本体构建与观点挖掘研究
项目编号: No.71403154
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 管理科学
项目作者: 由丽萍
作者单位: 山西大学
项目金额: 21万元
中文摘要: 本项目针对目前基于语义的观点挖掘研究中词汇知识库质量不高、系统语义理解能力不足的问题,提出基于FrameNet词典资源的中文评价词汇本体构建方法以及基于本体和深层语义分析的观点挖掘方法。研究内容包括:1)构建中文评价词汇的语义描述框架,通过本体表达词汇之间的语义关联,该词汇本体在框架语义理论和FrameNet的支撑下,具备语义描述科学、语义分类细化、表示能力强等特点。2)通过TCRF(树条件随机场)统计模型和规则库相结合的方法,实现框架语义元素以及情感属性的自动标注,达到对句子内部论元结构的深层理解。3)以评价词汇本体和框架元素自动标注为关键技术,开发一个观点挖掘系统,自动提取文本中的主题、观点、观点持有者、情感属性等,系统将具有较高的处理精度、较强的语义分析及语义推理能力。项目团队在通用领域汉语框架的构建和自动语义标注方面积累了丰富的成果和多项可用的中文文本分析工具,项目可行性较强。
中文关键词: 框架;语义;观点挖掘;情感分析;文本挖掘
英文摘要: Because of the low quality of lexicon knowledge base and the lack of semantic understanding in the current semantic-based opinion mining research, this project proposed a FrameNet-based Chinese affective lexicon ontology construction method and an ontolog
英文关键词: frame;semantic;opinion mining;sentiment analysis;text mining