项目名称: 汉语多文档意见信息聚集和融合方法研究
项目编号: No.61170148
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 付国宏
作者单位: 黑龙江大学
项目金额: 56万元
中文摘要: 如何有效发掘并以一种自然的方式聚集和融合散落在多个意见文档中的大量的、多样的、冗余的意见信息是目前意见挖掘和意见自动文摘要研究的热点,也是面临的主要挑战。本项目拟以大规模语料库调查为基础,探索不同领域的汉语意见信息表达的内在结构和模式以及意见信息结构表示模型;在情感分类和意见抽取基础上,采用基于语料库的机器学习方法,同时融合语义、句法和修辞等多种语言学特征以及领域情感知识,面向多个领域研究汉语多文档意见聚集和融合方法及关键技术,重点解决意见信息正规化(涵盖跨文档意见实体共指消解和意见复述识别)、基于意见信息结构的意见句子融合和领域情感知识自动获取等关键问题;进而构建一个基于文本-意见信息结构-文本模式的汉语多文档意见自动文摘技术框架及系统。本项目的实施不仅可为意见问答、意见检索和意见跟踪等系统奠定理论和技术基础,而且在政务智能、商业智能和舆情分析等领域具有十分广阔的应用前景。
中文关键词: 意见挖掘;意见聚集;意见融合;情感分类;噪声文本分析
英文摘要:
英文关键词: opinion mining;opinion aggregation;opinion fusion;sentiment classification;noisy text analysis