项目名称: 面向微博的实时事件深度挖掘研究
项目编号: No.61472335
项目类型: 面上项目
立项/批准年度: 2015
项目学科: 其他
项目作者: 林琛
作者单位: 厦门大学
项目金额: 80万元
中文摘要: 微博的迅猛发展使其成为各类事件策划、披露、讨论、传播与发展中心,也使其自然成为事件相关信息挖掘和知识发现的最佳和最主要数据来源。由于微博数据和事件本身的高动态性,对微博挖掘的信息需求是实时的、纵深化的和个性化的。本项目着眼于面向事件的微博文本的实时事件检索、事件脉络实时摘要以及事件摘要结果上的实时推荐,力求解决微博和类微博的短文本社交媒体数据流对数据处理、信息表示和算法设计提出的挑战,结合微博数据的文本特点、社会网络结构特点和事件演化规律,设计并实现无缝融合批处理/流处理的分布式大规模数据流处理平台,适用于社交短文本的信息表示模型,和一系列高效的实时深度挖掘算法;以期满足来自大量社交媒体应用对于事件实时和纵深信息的广泛需求,并推动大数据背景下数据管理理论与技术研究。
中文关键词: 文本挖掘;社会网络分析;知识发现;信息检索;多文档摘要
英文摘要: Microblog has emerged as the center for event creation, disclosure,discussion,spreading and evolution. It is regarded that Microblog is the dominant yet best data source for mining event-related information and knowledge. Due to the highly dynamic nature of Microblog data and evolutionary events, people demand real-time, in-depth and personalized information. In this project, we focus on real-time search, storyline summarization and recommendation in Microblogs to depict the eolution of events. To address the challenges arised by large-scale Microblog-alike brief text streams, the goal of this project is to propose a parallel platform for hybrid batch/streaming data processing, models to present information in Microblogs, and a series of efficient mining algorithms. The contributions of this project can be benefit for the development of data management theory and technology in the big data era.
英文关键词: Text Mining;Social Network Analysis;Knowledge Discovery;Information Retrieval;Multi-document Summarization