这本教科书在可再现金融上拉开帷幕,并展示了如何通过提供一个完全透明的R代码基础来应用金融和计量经济学的理论概念。聚焦于R的编码和数据分析,我们展示了学生、研究人员、数据科学家和专业人员如何从零开始进行实证金融研究。我们从对初学者友好的R包tidyverse系列介绍开始,我们的方法围绕着它。然后,展示如何访问和准备公共开源数据源(如法国数据库、宏观经济数据)和专有金融数据源(如CRSP、Compustat、merge FISD和TRACE)。我们使用SQLite数据库来介绍数据管理原则,它是后续章节中介绍的应用程序的基础。实证应用范围从实证资产定价的关键概念(例如beta估计、投资组合排序、性能分析和Fama-French因子)到建模和机器学习应用(例如固定效应估计、聚类标准误差、差中差估计器、岭回归、套索、弹性网络、随机森林和神经网络)和投资组合优化技术。1. 关于金融中最重要的应用和方法的独立章节,可以很容易地用于读者的研究或作为实证金融课程的参考。2. 每一章都是可复制的,因为读者可以通过简单地复制粘贴我们提供的代码来复制每一个图形、表格或数字。3.全面介绍机器学习,使用基于整齐原则的整齐模型,展示因素选择和期权定价如何从机器学习方法中受益。4. 一章展示了如何检索和准备金融经济学领域中最重要的数据集:CRSP和Compustat。本章还详细解释了最相关的数据特征。5. 每一章都提供了基于已建立的讲座和练习课程的练习,旨在帮助学生深入挖掘。这些练习可以用于自学,也可以作为教学练习的灵感来源。