项目名称: 高效能的互联网舆情信息分布式采集理论与算法研究
项目编号: No.61173145
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 计算机科学学科
项目作者: 张伟哲
作者单位: 哈尔滨工业大学
项目金额: 55万元
中文摘要: 互联网舆情信息采集是舆情分析、推演、预警和评估的前提和基础。舆情信息的时效性和舆情系统的成本约束等新的效能需求,对传统的舆情信息采集技术提出了挑战。分布式信息采集具备多网络接入点、就近采集和高伸缩性优势,为高效能舆情采集引入了新的契机,但其仍然存在缺乏效能评价模型、体系结构模型不成熟,负载不均衡,网络成本开销大等亟待解决的关键问题。本项目将重点考虑这些因素,以互联网舆情高效能分布式采集为核心科学问题,建立可量化的舆情信息系统效能模型,提出高效能的分布式舆情采集体系结构,在基于网络距离的Web划分、基于粒度切分与链接迁移的负载均衡、基于链接空间划分的网络成本优化等核心算法方面希望取得创新性成果。项目力争在高效能舆情采集的理论模型与算法方面取得突破,从而显著提高我国面对网络突发事件的应急响应能力,维护国家安全、保障社会和谐稳定。
中文关键词: 互联网舆情;分布式信息采集;高效能;时效性;成本优化
英文摘要:
英文关键词: Internet Public Opinion;Distributed Information Crawling;High Efficiency;Effectiveness;Cost Optimization