项目名称: 面向Web主观性文本意见挖掘研究
项目编号: No.61370137
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 牛振东
作者单位: 北京理工大学
项目金额: 75万元
中文摘要: 面向Web主观性文本意见挖掘通过自动的方法对博客、微博、在线评论等Web主观性文本信息进行挖掘和分析。它是智能信息处理、数据挖掘、计算语言学等领域的前沿性课题,通常面临着情感特征空间巨大,有效特征稀疏、情感词典构建困难等问题。本项目主要研究Web主观性文本细粒度意见挖掘、自适应评价特征聚类和领域情感词典自动构建等关键技术。针对细粒度意见挖掘中存在有效特征稀疏和缺乏统一框架的问题,研究基于序列标注学习的融合多级特征的细粒度挖掘模型。针对评价特征聚类中存在的语义关联信息不足的问题,提出基于约束谱聚类的自适应评价特征聚类算法。针对情感词典自动构建中存在的领域依赖性和情感关联信息不足问题,研究如何自动获取领域先验知识和增强候选情感词之间的情感关联信息,提出基于约束标签传递的领域情感自动构建算法,该方法可解决传统领域情感词典构建中需要人工标注领域数据的问题,具有良好的领域适应性。
中文关键词: 意见挖掘;情感分析;Web主观性文本;评价特征;情感词典
英文摘要: Subjective Web text oriented opinion mining aims at automatically mining and analyzing the subjective types of text including blogs, micro blogs and online reviews on the Web. It has become a hot research topic in the fields of intelligent information pro
英文关键词: Opinion Mining;Sentiment Analysis;Subjective Web Text;Opinionated Feature;Sentiment Lexicon