Human communication is inherently multimodal and asynchronous. Analyzing human emotions and sentiment is an emerging field of artificial intelligence. We are witnessing an increasing amount of multimodal content in local languages on social media about products and other topics. However, there are not many multimodal resources available for under-resourced Dravidian languages. Our study aims to create a multimodal sentiment analysis dataset for the under-resourced Tamil and Malayalam languages. First, we downloaded product or movies review videos from YouTube for Tamil and Malayalam. Next, we created captions for the videos with the help of annotators. Then we labelled the videos for sentiment, and verified the inter-annotator agreement using Fleiss's Kappa. This is the first multimodal sentiment analysis dataset for Tamil and Malayalam by volunteer annotators.


翻译:分析人类情绪和情绪是人工智能的一个新兴领域。我们看到,在关于产品和其他主题的社交媒体上,当地语言的多式内容越来越多。然而,没有太多的多式资源可用于资源不足的德拉维迪亚语言。我们的研究旨在为资源不足的泰米尔语和马拉亚拉姆语创建一个多式情绪分析数据集。首先,我们从YouTube下载了泰米尔语和马拉亚拉姆语的产品或电影审查视频。接着,我们在告发员的帮助下为视频制作了字幕。然后,我们用Fleiss的Kappa为视频贴上了情绪标签,并核实了机构间协议。这是由自愿告发员为泰米尔语和马拉亚拉姆语制作的第一个多式情绪分析数据集。

0
下载
关闭预览

相关内容

专知会员服务
123+阅读 · 2020年9月8日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
已删除
AI掘金志
7+阅读 · 2019年7月8日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
笔记 | Sentiment Analysis
黑龙江大学自然语言处理实验室
10+阅读 · 2018年5月6日
Linguistically Regularized LSTMs for Sentiment Classification
黑龙江大学自然语言处理实验室
8+阅读 · 2018年5月4日
干货:必读机器学习书籍一览表
专知
7+阅读 · 2018年2月19日
carla 学习笔记
CreateAMind
9+阅读 · 2018年2月7日
深度学习NLP相关资源大列表
机器学习研究会
3+阅读 · 2017年9月17日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Arxiv
25+阅读 · 2018年1月24日
Arxiv
5+阅读 · 2018年1月23日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
专知会员服务
123+阅读 · 2020年9月8日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
相关资讯
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
已删除
AI掘金志
7+阅读 · 2019年7月8日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
笔记 | Sentiment Analysis
黑龙江大学自然语言处理实验室
10+阅读 · 2018年5月6日
Linguistically Regularized LSTMs for Sentiment Classification
黑龙江大学自然语言处理实验室
8+阅读 · 2018年5月4日
干货:必读机器学习书籍一览表
专知
7+阅读 · 2018年2月19日
carla 学习笔记
CreateAMind
9+阅读 · 2018年2月7日
深度学习NLP相关资源大列表
机器学习研究会
3+阅读 · 2017年9月17日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Top
微信扫码咨询专知VIP会员