项目名称: 面向海量文本数据的社会网络系统演化性与计算方法研究

项目编号: No.60873204

项目类型: 面上项目

立项/批准年度: 2009

项目学科: 金属学与金属工艺

项目作者: 周斌

作者单位: 中国人民解放军国防科学技术大学

项目金额: 29万元

中文摘要: 面向海量文本数据的社会网络系统演化性与计算方法的研究面临的挑战概括为三个方面:1)网络节点的自主协同带来的系统动态演化建模难问题;2)海量文本数据带来的计算准确性和时效性问题;以及3)语义多样性带来的概念描述不确定性问题。 针对上述研究问题,项目从海量文本数据的内容分析、社会网络系统演化性,以及计算平台与典型应用等三方面展开了研究,重点研究了包括交互文本的会话抽取、面向多准则约束的社区发现方法、基于种子扩展的局部社区发现方法、基于概率模型的话题演化模型、基于原子事件的演化模式挖掘、基于频繁模式影响群落挖掘、分布式计算平台及应用等一系列关键技术,并在新浪微博、腾讯微博、Twitter等多种微博应用上完成了实验。研究工作回答了信息如何影响社会网络的演化、社会网络应用的网络结构如何影响信息的演化、以及如何基于大规模网络计算平台对上述演化过程进行有效计算等问题。 本课题按照计划执行,圆满完成了计划书的研究内容,共发表高水平学术论文18篇,超出既定目标125%,进入SCI/EI的比例达到78%,结合课题研究,共培养博士生4名,硕士生6名,研究成果形成了面向微博的舆情分析与挖掘原型系统。

中文关键词: 社会网络;演化性;文本挖掘;社区发现;话题模型

英文摘要: The research problems and challenges on how a social network system evolves and how to compute it can be classified into three categories: 1) the system evolution modeling problems caused by the autonomic collaboration of various network nodes; 2) the computation accuracy and efficiency requirements due to the extremely large volumes of data to be processed; and 3) the uncertainty caused by the semantic diversity of the concepts and contents. This project tries to solve these challenges in three ways, i.e., content analysis of massive textual data, system evolution modeling of social networks, and the computation platforms and applications. The main research topics include session extraction, community discovery and mining, probabilistic topic model, event evolutionary model mining, and the distributed computing parallel platforms. Experiments are carried out on various real world applications such as Sina weibo, Tencent microblog and Twitter. The research results partially answered the questions of how information influences the social network and its evolution and verse vice, and how to compute the processes by utilizing the state-of-the-art distributed platforms. The project finished with all the research missions accomplished. The researchers published eighteen research papers. Fourteen of them were indexed by SCI or EI. Four Ph.D candidates and six masters were supported by this project. One of them finish his defense in Nov, 2011. The majority of research works has been put into the codebase of a prototype system of microblog monitoring and mining.

英文关键词: social network;evolution;text mining;community discovery;topic model

成为VIP会员查看完整内容
0

相关内容

《面向制造业的数字化仿真分类》国家标准意见稿
专知会员服务
65+阅读 · 2022年4月13日
专知会员服务
36+阅读 · 2021年7月8日
专知会员服务
29+阅读 · 2021年6月4日
【干货书】面向计算科学和工程的Python导论,167页pdf
专知会员服务
41+阅读 · 2021年4月7日
专知会员服务
41+阅读 · 2021年3月28日
专知会员服务
16+阅读 · 2021年2月17日
【WSDM2021】基于演化状态图的时间序列事件预测
专知会员服务
52+阅读 · 2020年12月1日
专知会员服务
193+阅读 · 2020年10月14日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
36+阅读 · 2020年4月26日
计算体系架构研究综述与思考
专知
2+阅读 · 2022年3月22日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
计算文本相似度常用的四种方法
论智
33+阅读 · 2018年5月18日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
14+阅读 · 2018年4月18日
小贴士
相关VIP内容
《面向制造业的数字化仿真分类》国家标准意见稿
专知会员服务
65+阅读 · 2022年4月13日
专知会员服务
36+阅读 · 2021年7月8日
专知会员服务
29+阅读 · 2021年6月4日
【干货书】面向计算科学和工程的Python导论,167页pdf
专知会员服务
41+阅读 · 2021年4月7日
专知会员服务
41+阅读 · 2021年3月28日
专知会员服务
16+阅读 · 2021年2月17日
【WSDM2021】基于演化状态图的时间序列事件预测
专知会员服务
52+阅读 · 2020年12月1日
专知会员服务
193+阅读 · 2020年10月14日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
36+阅读 · 2020年4月26日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员