项目名称: 基于语义理解的面向特定主题的微博舆情监控技术研究

项目编号: No.61303190

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 李莎莎

作者单位: 中国人民解放军国防科学技术大学

项目金额: 23万元

中文摘要: 网络舆情监控是当前政府和研究领域最关心的问题之一,而微博又是舆情监控的重点和难点。本项目以目前主流的中文微博为研究对象和平台,针对微博内容产生及传播迅速、非正规化、信息稀疏等特点,对面向特定主题的微博舆情监控的关键技术进行研究,通过对主题和微博文本的充分的语义理解,增强面向特定主题的舆情感知和追踪的实时性和准确性。首先,针对微博数据非正规化导致传统自然语言处理技术难以应用的特点,研究消除微博数据噪音的正规化方法;其次,针对微博数据语言个性化、多样化以及多变性所导致的已有本体库不适用问题,研究适用于微博数据的微博知识库的建立与更新;然后,针对微博文本篇幅短小所造成的信息稀疏问题,提出微博数据的语义化表示方法;接着,针对微博数据所具有的高速数据流特点以及微博舆情监控的实时性要求,研究基于语义搜索的高效流数据处理算法;最后,建立可交互监控机制,通过监控过程中的人机交互,实现监控模型的不断完善。

中文关键词: 微博;舆情热点预测与追踪;语义理解;词向量;深度学习

英文摘要: Network public opinion monitoring is one of the most concerned problems of governments and researchers. Forthermore, microblog is the most important and difficult application to monitor, since its content grows fast and is not regular or dense. In this project, we are going to research key technology to monitor microblog for subject oriented, to increaing the performance of real-time-ability and accuracy. Firstly, to avoid the the difficulty of applying traditinal method to the nonregular mcroblog data, we will research a method to reduce the noise from microblog data.Secondly,we will research how to build a microblog database related to the interest of users that is suitable for mcroblog data, and propose a formal expression method of mcroblog data. Thirdly,in the face of high traffic of microblog data and the real-time requiement when monitoring public sentiment of microblog, we will propose an effcient method to deal with microblog data. Fouthly, we will build an inter-active monitoring mechnisim to make the microblog database learn itself by exchanging with human and machine. This would continuly increase the accuracy of monitoring when using the monitor systems.

英文关键词: microblog;public opinion tracking;semantic understanding;word vector;deep learning

成为VIP会员查看完整内容
2

相关内容

微博是一种基于用户关系的信息分享、传播以及获取平台,用户可以通过 web、WAP以及各种客户端组建个人社区,以 140 字左右的文字更新信息,并实现即时分享。
面向语义搜索的自然语言处理
专知会员服务
59+阅读 · 2021年12月18日
面向知识图谱的知识推理综述
专知会员服务
147+阅读 · 2021年11月1日
专知会员服务
68+阅读 · 2021年10月6日
专知会员服务
69+阅读 · 2021年5月21日
基于深度学习的行人检测方法综述
专知会员服务
68+阅读 · 2021年4月14日
专知会员服务
111+阅读 · 2021年1月8日
专知会员服务
48+阅读 · 2020年11月20日
专知会员服务
107+阅读 · 2020年10月27日
专知会员服务
193+阅读 · 2020年10月14日
专知会员服务
44+阅读 · 2020年8月20日
基于深度学习的交互式问答研究综述
专知
0+阅读 · 2021年11月30日
面向Transformer模型的高效预训练方法
哈工大SCIR
1+阅读 · 2021年6月5日
文本情感分析方法研究综述
专知
4+阅读 · 2021年4月20日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
关系推理:基于表示学习和语义要素
计算机研究与发展
18+阅读 · 2017年8月22日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Chinese Idiom Paraphrasing
Arxiv
0+阅读 · 2022年4月15日
Arxiv
1+阅读 · 2022年4月15日
Arxiv
30+阅读 · 2021年7月7日
小贴士
相关VIP内容
面向语义搜索的自然语言处理
专知会员服务
59+阅读 · 2021年12月18日
面向知识图谱的知识推理综述
专知会员服务
147+阅读 · 2021年11月1日
专知会员服务
68+阅读 · 2021年10月6日
专知会员服务
69+阅读 · 2021年5月21日
基于深度学习的行人检测方法综述
专知会员服务
68+阅读 · 2021年4月14日
专知会员服务
111+阅读 · 2021年1月8日
专知会员服务
48+阅读 · 2020年11月20日
专知会员服务
107+阅读 · 2020年10月27日
专知会员服务
193+阅读 · 2020年10月14日
专知会员服务
44+阅读 · 2020年8月20日
相关资讯
基于深度学习的交互式问答研究综述
专知
0+阅读 · 2021年11月30日
面向Transformer模型的高效预训练方法
哈工大SCIR
1+阅读 · 2021年6月5日
文本情感分析方法研究综述
专知
4+阅读 · 2021年4月20日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
关系推理:基于表示学习和语义要素
计算机研究与发展
18+阅读 · 2017年8月22日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员