在过去的十年里,计算和信息技术突飞猛进。随之而来的是医学、生物学、金融和市场营销等各个领域的大量数据。这本书用一个共同的概念框架来描述这些领域的重要思想。
在这篇专著中,我们尝试总结了稀疏性统计学习这一积极发展的领域。稀疏统计模型是一种只有少量非零参数或权重的模型。它代表了“少即是多”的经典案例: 稀疏模型比密集模型更容易估计和解释。在这个大数据时代,对一个人或物体测量的特征数量可能会很大,甚至可能比观察到的数量还要多。稀疏性假设允许我们处理此类问题,并从大数据集中提取有用的和可重现的模式。
https://web.stanford.edu/~hastie/StatLearnSparsity/