高维统计介绍,第二版保留了第一版的哲学:为学生和研究人员发现的领域和感兴趣的数学所涉及的简明指南。主要的概念和想法在简单的设置中呈现,从而避免不必要的技术细节。高维统计是一个快速发展的领域,在许多不同的主题上取得了很大的进展,提供了新的见解和方法。提供了高维统计的数学基础的简明介绍,这个新版:
提供了从上一版修订的章节,包括一些重要主题的许多额外的材料,包括压缩感知,凸约束估计,斜率估计,同时低秩和行稀疏线性回归,或连续估计集的聚合。 * 介绍了关于迭代算法、聚类和极大极小下界的三个新章节。 * 提供了增强的附录,极大极小下界主要是添加了Davis-Kahan扰动界和两个简单版本的Hanson-Wright浓度不等式。 * 涵盖了前沿的统计方法,包括模型选择、稀疏性和Lasso、迭代硬阈值、聚合、支持向量机和学习理论。 * 在每一章末尾提供详细的练习,并在wiki站点上提供协作解决方案。 * 用简单但清楚的实际例子说明概念。
随着技术、数据存储资源和计算资源的持续发展,生产、存储和处理的数据量呈指数级增长。数据无处不在,对人类活动的几乎每一个分支都有巨大影响,包括科学、医学、商业、金融和管理。例如,大规模数据使我们能够更好地了解生物有机体的调节机制,创造新的疗法,监测气候和生物多样性的变化,优化行业和管理部门的资源,为每个消费者进行个性化营销,等等。 现代数据的一个主要特征是,它们经常同时记录每个物体或个人的数千到数百万个特征。这样的数据被称为高维数据。让我们用几个例子来说明这个特点。这些例子在写作时是相关的,可能在几年后就会过时,但我们强调,本书中所传达的数学思想是独立于这些例子的,并将继续相关。 这本书的重点是高维统计的数学基础,这显然是在“数学统计”流。它的目标是提出高维统计的主要概念,并在一些基本情况下划定可实现和不可能之间的边界。这本书集中于处理高维数据的最新技术。他们不努力收集统计方法的全面目录;相反,他们试图为一些选定的主题解释关键的基本概念和思想。这些概念和想法都是在简单的设置中暴露出来的,这样可以避免不必要的技术细节,使注意力集中在主要论点上。从最近的研究文献中发出的证明已被大量精简,以启发主要论点。我们邀请读者在每章末尾的详细练习中将这些想法应用到更复杂的环境中。我们也欢迎他在专门的维基网站http://high-dimensional-statistics.wikidot.com上分享他的解决方案。