Social media such as Twitter, Facebook, etc. has led to a generated growing number of comments that contains users opinions. Sentiment analysis research deals with these comments to extract opinions which are positive or negative. Arabic language is a rich morphological language; thus, classical techniques of English sentiment analysis cannot be used for Arabic. Word embedding technique can be considered as one of successful methods to gaping the morphological problem of Arabic. Many works have been done for Arabic sentiment analysis based on word embedding, but there is no study focused on variable parameters. This study will discuss three parameters (Window size, Dimension of vector and Negative Sample) for Arabic sentiment analysis using DBOW and DMPV architectures. A large corpus of previous works generated to learn word representations and extract features. Four binary classifiers (Logistic Regression, Decision Tree, Support Vector Machine and Naive Bayes) are used to detect sentiment. The performance of classifiers evaluated based on; Precision, Recall and F1-score.


翻译:社交媒体,如Twitter、Facebook等,产生了越来越多的载有用户意见的评论。感知分析研究涉及这些评论,以得出正面或负面的意见。阿拉伯语是一种丰富的形态语言;因此,英语情绪分析的古典技术不能用于阿拉伯语。文字嵌入技术可以被视为弥合阿拉伯语形态问题的成功方法之一。许多基于文字嵌入的阿拉伯情绪分析工作已经完成,但没有研究以变量参数为重点。这项研究将讨论使用 DBOW 和 DMPV 结构进行阿拉伯语情绪分析的三个参数(温多、矢量尺寸和负抽样)。以前为学习文字表达和摘要特征而制作的大量作品。使用四种二进制分类器(Logistric Returation、决定树、支持矢量机器和养蜂湾)来检测情绪。根据精度、回调和F1-分数评估的分类器的性能。

0
下载
关闭预览

相关内容

狭义的情感分析(sentiment analysis)是指利用计算机实现对文本数据的观点、情感、态度、情绪等的分析挖掘。广义的情感分析则包括对图像视频、语音、文本等多模态信息的情感计算。简单地讲,情感分析研究的目标是建立一个有效的分析方法、模型和系统,对输入信息中某个对象分析其持有的情感信息,例如观点倾向、态度、主观观点或喜怒哀乐等情绪表达。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
基于Lattice LSTM的命名实体识别
微信AI
47+阅读 · 2018年10月19日
论文 | 中文词向量论文综述(二)
黑龙江大学自然语言处理实验室
3+阅读 · 2018年8月22日
干货 | 为你解读34篇ACL论文
数据派THU
8+阅读 · 2018年6月7日
笔记 | Sentiment Analysis
黑龙江大学自然语言处理实验室
10+阅读 · 2018年5月6日
Linguistically Regularized LSTMs for Sentiment Classification
黑龙江大学自然语言处理实验室
8+阅读 · 2018年5月4日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
5+阅读 · 2018年1月23日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
相关资讯
基于Lattice LSTM的命名实体识别
微信AI
47+阅读 · 2018年10月19日
论文 | 中文词向量论文综述(二)
黑龙江大学自然语言处理实验室
3+阅读 · 2018年8月22日
干货 | 为你解读34篇ACL论文
数据派THU
8+阅读 · 2018年6月7日
笔记 | Sentiment Analysis
黑龙江大学自然语言处理实验室
10+阅读 · 2018年5月6日
Linguistically Regularized LSTMs for Sentiment Classification
黑龙江大学自然语言处理实验室
8+阅读 · 2018年5月4日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Top
微信扫码咨询专知VIP会员