项目名称: 基于多层次语言粒度的文本情感分类研究

项目编号: No.60875040

项目类型: 面上项目

立项/批准年度: 2009

项目学科: 轻工业、手工业

项目作者: 王素格

作者单位: 山西大学

项目金额: 30万元

中文摘要: 本项目对多层次语言粒度下的文本情感分类进行了系统研究,主要研究结果如下:(1)建立了面向中文情感分类的情感词表、搭配库、句子库和文本语料库资源。(2)通过词间的语义关系,提出了词汇、搭配的情感倾向识别,量化了情感倾向强度,并将这些研究成果用于句子的情感倾向判别中。(3)从特征的类别区分能力角度,设计了基于Fisher判别准则函数,提出了一种高效的文本情感分类特征选择方法。(4)利用特征倾向强度,建立了基于二元组属性的文本表示模型。提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到了数据降维的目的。利用特征倾向强度,定义了赋权粗糙隶属度,用于新文本的情感分类。(5)将概念格和粒度计算引入到本体研究中,为本体的构建、合并和连接提供了一种统一的基于领域本体基的不同粒度下的知识获取模型,为专家判定概念间和本体之间的关系提供了一定依据。(6)通过粗糙隶属函数定义了两个概念之间的距离,设计了不同滑动窗口下聚类结果演化趋势的可视化算法。(7)将上述理论成果应用于汽车和旅游领域,不仅丰富了文本情感分类的理论成果,同时对主观性文本数据处理提供了新方法与新技术。

中文关键词: 文本情感分类;多层次语言粒度;粗糙集理论;特征选择;本体

英文摘要: In this project, text sentiment orientation classification methods from the view of multi-hierarchy linguistic granularity have been systemically researched. Its main results are as follows: (1)The resources have been established,such as sentiment words table, colloctation base, sentences base and corpora. (2)Using Semantic relationships between words and quantifying their sentiment orientation intensity, sentiment orientation identification methods for words, collactions and sentence are proposed. (3)From the viewpoint of the contribution of a candidate feature to distinguishing text sort, a kind of effective feature selection method based on improved Fisher's discriminant ratio is proposed for text sentiment classification. By considering two kinds of probability estimations, four kinds of feature selecting techniques are then proposed. (4)A method of text sentiment classification based on weighted rough membership is proposed. In the method, the model of text expression is established based on two-tuples attribute, by introducing feature orientation intensity into the method of vector space representation. An attribute discrete method is proposed based on the sentiment orientation sequence for feature selection unifying the discretization processing to depress data dimension. To utilize the feature orientation intensity, a weighted rough membership is defined for classifying new sentiment text. (5)By introducing concept lattice and granular computing into ontology learning, and a unified research model is presented for ontology building, ontology merging and ontology connection based on the domain ontology base in different granulations. In this model, based on similarity models mentioned above, the ontology building, ontology merging and ontology connection can be obtained in different granulations with the help of domain experts. (6)The cluster time-evolving data is proposed based on the rough membership function and the sliding-window technique by defining the distance between two concepts. (7)The theoretical results metioned above are applied to car and tour domain. These results not only enrich text sentiment orientation classification theory, but also provide new theory and effective technology for subjective text data processing.

英文关键词: text sentiment classification; multi-hierarchy linguistic granularity; rough set theory; feature selection; ontology

成为VIP会员查看完整内容
1

相关内容

多语言语音识别声学模型建模方法最新进展
专知会员服务
33+阅读 · 2022年2月7日
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
专知会员服务
71+阅读 · 2021年5月21日
专知会员服务
55+阅读 · 2021年4月20日
专知会员服务
16+阅读 · 2021年2月17日
专知会员服务
65+阅读 · 2020年12月24日
【ICML2020-西电】用于语言生成的递归层次主题引导RNN
专知会员服务
21+阅读 · 2020年6月30日
【CCL 2019】结合规则蒸馏的情感原因发现方法
专知会员服务
22+阅读 · 2019年11月27日
微软亚洲研究院提出多语言通用文档理解预训练模型LayoutXLM
微软研究院AI头条
2+阅读 · 2021年6月1日
文本情感分析方法研究综述
专知
4+阅读 · 2021年4月20日
R语言自然语言处理:情感分析
R语言中文社区
16+阅读 · 2019年4月16日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
计算文本相似度常用的四种方法
论智
33+阅读 · 2018年5月18日
从语言学到深度学习NLP,一文概述自然语言处理
人工智能学家
13+阅读 · 2018年1月28日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
深度学习 | 利用词嵌入对文本进行情感分析
沈浩老师
11+阅读 · 2017年10月19日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Hierarchical Graph Capsule Network
Arxiv
20+阅读 · 2020年12月16日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
33+阅读 · 2022年2月7日
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
专知会员服务
71+阅读 · 2021年5月21日
专知会员服务
55+阅读 · 2021年4月20日
专知会员服务
16+阅读 · 2021年2月17日
专知会员服务
65+阅读 · 2020年12月24日
【ICML2020-西电】用于语言生成的递归层次主题引导RNN
专知会员服务
21+阅读 · 2020年6月30日
【CCL 2019】结合规则蒸馏的情感原因发现方法
专知会员服务
22+阅读 · 2019年11月27日
相关资讯
微软亚洲研究院提出多语言通用文档理解预训练模型LayoutXLM
微软研究院AI头条
2+阅读 · 2021年6月1日
文本情感分析方法研究综述
专知
4+阅读 · 2021年4月20日
R语言自然语言处理:情感分析
R语言中文社区
16+阅读 · 2019年4月16日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
计算文本相似度常用的四种方法
论智
33+阅读 · 2018年5月18日
从语言学到深度学习NLP,一文概述自然语言处理
人工智能学家
13+阅读 · 2018年1月28日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
深度学习 | 利用词嵌入对文本进行情感分析
沈浩老师
11+阅读 · 2017年10月19日
相关基金
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员