导读
大数据在科研和应用领域中都得到了极大的关注。然而,目前大部分工作都集中在系统和应用方向,解决与“容量”和“速度”相关的问题;从理论基础出发,研究“多样性”的课题还比较匮乏。
本文作者中科院院士陈国良教授、深圳大学毛睿教授、陆克中教授基于度量空间索引和计算复杂性理论,提出一个大数据并行计算框架。此框架由3部分组成:
首先将各种数据类型抽象成度量空间以实现大数据的通用表示;
然后在度量空间中基于距离进行大数据的划分;
最后采用 NC 计算理论对大数据进行并行计算。
文章精要
如需阅读本期推荐文章的全文,请点左下角的「阅读原文」链接。
Frontiers of Computer Science
Frontiers of Computer Science 是由教育部主管、高等教育出版社和德国 Springer 公司共同出版的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为李未院士,执行主编为熊璋教授和周志华教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”。
长按二维码关注Frontiers of Computer Science公众号