这本教材旨在从数学的角度指出数据分析的最重要的原则。具体来说,它选择了这些问题进行探索:哪些是理解应用的含义所必需的原则,哪些是理解所使用的方法成功的条件所必需的?理论只在适当应用的必要程度上呈现,力求在过度复杂和过度简化之间取得平衡。它的主要重点是应用成功的关键原则。主题及特点:
- 侧重于由数学参数支持的方法,而不是单一的计算经验
- 研究在数据科学中使用的数值算法运行的条件,以及可以预期的性能
- 考虑关键的数据科学问题:问题的制定包括最优性度量;学习和泛化与训练集大小和自由参数数量的关系;以及数值算法的收敛性
- 检查原始的数学学科(统计学,数值数学,系统论),因为它们与给定的问题特别相关
- 解决模型大小和可用于识别的数据量之间的权衡及其对模型参数化的影响
- 研究自然语言处理和计算机视觉所涉及的数学原理
- 保持主题覆盖有意紧凑,专注于每个主题的关键问题,以鼓励充分理解整本书
虽然这本核心教材直接针对计算机科学和/或数据科学的学生,但它也将对该领域的研究人员具有真正的吸引力,他们希望获得“超越”唯一计算经验的数学基础的正确理解。
https://link.springer.com/book/10.1007/978-3-031-19074-2