项目名称: 自适应的中文网络意见挖掘关键技术研究
项目编号: No.60973081
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 付国宏
作者单位: 黑龙江大学
项目金额: 30万元
中文摘要: 从网络评论中挖掘意见信息是当前网络信息处理研究领域的热点问题之一。领域适应性和性能稳定性是目前意见挖掘系统在处理大规模开放网络文本时所面临的两个主要问题。针对这些问题,结合中文网络评论的特点,本项目拟以自然语言处理技术为基础,融合多种语言学知识,在机器学习框架下研究自适应的中文网络意见挖掘关键技术。主要研究内容包括:研究面向网络评论文本的中文处理技术,重点解决网络文本存在的次生成问题;研究中文情感知识获取和意见语料构造方法,重点研究领域和上下文相关的动态情感知识自动获取方法,以提高系统的自适应能力;研究模式匹配和情感密度相结合的主观性识别算法;在机器学习框架下研究融合多个特征和情感知识的意见抽取和极性分类方法,重点研究特征选择和优化算法,以提高系统的性能稳定性。本项目的实施对自然语言处理、信息检索、文本挖掘、自动文摘、问答系统和智能信息服务等研究领域具有重要的科学意义和应用前景。
中文关键词: 意见挖掘;情感分类;意见文本分析;意见语料标注;机器学习
英文摘要:
英文关键词: opinion mining;sentiment classification;opinion text analysis;opinion corpus annotation;machine learning