项目名称: 面向微博的实时事件深度挖掘研究

项目编号: No.61472335

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 其他

项目作者: 林琛

作者单位: 厦门大学

项目金额: 80万元

中文摘要: 微博的迅猛发展使其成为各类事件策划、披露、讨论、传播与发展中心,也使其自然成为事件相关信息挖掘和知识发现的最佳和最主要数据来源。由于微博数据和事件本身的高动态性,对微博挖掘的信息需求是实时的、纵深化的和个性化的。本项目着眼于面向事件的微博文本的实时事件检索、事件脉络实时摘要以及事件摘要结果上的实时推荐,力求解决微博和类微博的短文本社交媒体数据流对数据处理、信息表示和算法设计提出的挑战,结合微博数据的文本特点、社会网络结构特点和事件演化规律,设计并实现无缝融合批处理/流处理的分布式大规模数据流处理平台,适用于社交短文本的信息表示模型,和一系列高效的实时深度挖掘算法;以期满足来自大量社交媒体应用对于事件实时和纵深信息的广泛需求,并推动大数据背景下数据管理理论与技术研究。

中文关键词: 文本挖掘;社会网络分析;知识发现;信息检索;多文档摘要

英文摘要: Microblog has emerged as the center for event creation, disclosure,discussion,spreading and evolution. It is regarded that Microblog is the dominant yet best data source for mining event-related information and knowledge. Due to the highly dynamic nature of Microblog data and evolutionary events, people demand real-time, in-depth and personalized information. In this project, we focus on real-time search, storyline summarization and recommendation in Microblogs to depict the eolution of events. To address the challenges arised by large-scale Microblog-alike brief text streams, the goal of this project is to propose a parallel platform for hybrid batch/streaming data processing, models to present information in Microblogs, and a series of efficient mining algorithms. The contributions of this project can be benefit for the development of data management theory and technology in the big data era.

英文关键词: Text Mining;Social Network Analysis;Knowledge Discovery;Information Retrieval;Multi-document Summarization

成为VIP会员查看完整内容
1

相关内容

社会网络分析方法是由社会学家根据数学方法﹑图论等发展起来的定量分析方法,近年来,该方法在职业流动、城市化对个体幸福的影响、世界政治和经济体系、国际贸易等领域广泛应用,并发挥了重要作用。社会网络分析是社会学领域比较成熟的分析方法,社会学家们利用它可以比较得心应手地来解释一些社会学问题。许多学科的专家如经济学、管理学等领域的学者们在新经济时代——知识经济时代,面临许多挑战时,开始考虑借鉴其他学科的研究方法,社会网络分析就是其中的一种。
专知会员服务
127+阅读 · 2021年8月13日
专知会员服务
128+阅读 · 2021年6月18日
专知会员服务
126+阅读 · 2021年6月12日
最新《图机器学习》综述论文,19页pdf
专知会员服务
152+阅读 · 2021年5月5日
专知会员服务
29+阅读 · 2021年2月17日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
68+阅读 · 2021年2月7日
【WWW2021】基于图神经网络的社交好友排序
专知会员服务
49+阅读 · 2021年2月3日
专知会员服务
197+阅读 · 2020年10月14日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
108+阅读 · 2020年5月3日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
143+阅读 · 2019年10月10日
基于知识图谱的推荐系统总结
机器学习与推荐算法
4+阅读 · 2021年11月11日
事件知识图谱构建研究进展与趋势
THU数据派
99+阅读 · 2019年12月11日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
事理图谱:事件演化的规律和模式
哈工大SCIR
34+阅读 · 2019年7月19日
【推荐系统】深度解析京东个性化推荐系统演进史
产业智能官
23+阅读 · 2017年12月8日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Table Enrichment System for Machine Learning
Arxiv
0+阅读 · 2022年4月18日
Arxiv
31+阅读 · 2021年3月29日
Arxiv
24+阅读 · 2021年1月25日
Arxiv
14+阅读 · 2020年10月26日
Arxiv
25+阅读 · 2018年1月24日
小贴士
相关VIP内容
专知会员服务
127+阅读 · 2021年8月13日
专知会员服务
128+阅读 · 2021年6月18日
专知会员服务
126+阅读 · 2021年6月12日
最新《图机器学习》综述论文,19页pdf
专知会员服务
152+阅读 · 2021年5月5日
专知会员服务
29+阅读 · 2021年2月17日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
68+阅读 · 2021年2月7日
【WWW2021】基于图神经网络的社交好友排序
专知会员服务
49+阅读 · 2021年2月3日
专知会员服务
197+阅读 · 2020年10月14日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
108+阅读 · 2020年5月3日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
143+阅读 · 2019年10月10日
相关资讯
基于知识图谱的推荐系统总结
机器学习与推荐算法
4+阅读 · 2021年11月11日
事件知识图谱构建研究进展与趋势
THU数据派
99+阅读 · 2019年12月11日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
事理图谱:事件演化的规律和模式
哈工大SCIR
34+阅读 · 2019年7月19日
【推荐系统】深度解析京东个性化推荐系统演进史
产业智能官
23+阅读 · 2017年12月8日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
微信扫码咨询专知VIP会员