近年来,语言建模的最新进展引发了人们对将自然语言处理(NLP)技术应用于金融问题的广泛关注,从而推动了分析与决策的新方法的发展。为系统性地审视这一趋势,我们回顾了2017年至2024年间在38个会议和研讨会上发表的374篇NLP研究论文,并重点分析了其中221篇直接涉及金融相关任务的研究。 我们从11个定性与定量维度对这些论文进行了评估,识别出了一些关键趋势,例如通用语言模型的使用日益增加、情感分析与信息抽取技术的持续进展,以及在可解释性与隐私保护方法方面的新兴探索。我们还讨论了评估指标的使用,强调了在标准机器学习指标之外,采用领域特定评估指标的重要性。 我们的研究结果凸显出构建更具可访问性和适应性的金融数据集的必要性,并指出纳入金融危机期间数据对于增强模型在真实环境下的鲁棒性具有重要意义。本综述为NLP在金融领域的研究提供了结构化的回顾,并为在该交叉领域工作的研究人员和实践者提供了实用见解。
语言建模已成为自然语言处理(NLP)中的关键工具,广泛应用于分析非结构化文本,如报告、新闻文章和社交媒体帖子。这些方法正日益被用于处理金融相关任务,例如情感分析(Balakrishnan 等,2022)、信息抽取(Huang 等,2023)、摘要生成(Khanna 等,2022)、股票预测(Jain 与 Agrawal,2024)以及波动率预测(Niu 等,2023)。随着越来越多的 NLP 研究论文聚焦于金融问题,有必要系统地审视该领域对金融应用的贡献。
尽管已有若干综述探讨了 NLP 与金融的交叉点(见表1),但许多综述主要采用定性方法(Chen 等,2022b;Gao 等,2021b;Xiao 等,2024a),着眼于广义 NLP 技术(Jagdale 与 Deshmukh,2025;Man 等,2019;Liu,2024)、深度学习(Ozbayoglu 等,2020)以及大语言模型(LLMs)(Nie 等,2024;Li 等,2023c),或聚焦于特定任务如情感分析(Mishev 等,2020)。然而,这些研究往往缺乏系统性的评估。 本研究专注于应用于金融领域的 NLP 研究。我们的研究范围包括在 NLP 相关会议中发表的论文,这些论文在金融问题上开发、测试或调整了 NLP 方法。我们分析了2017至2024年间发表于38个 NLP 会议和研讨会的共计374篇论文。经过进一步筛选(见第2节),最终保留了221篇直接涉及金融任务的论文。这些论文从11个定性与定量维度进行评估,包括任务类型、方法论、数据集、评估指标以及可获取性等方面。 我们的分析揭示了当前研究中的若干模式。常见任务包括情感分析、信息抽取和问答系统,而诸如可解释性和隐私保护等领域则相对较少被关注(见第3节)。在评估方面,标准机器学习指标被广泛采用,但这些指标并不总能准确反映金融领域的具体需求(见第7.1节)。多数研究集中于市场相对稳定的时期,较少关注波动性较大的时期(见第7.2节),并存在依赖过时数据源或忽视幸存者偏差等问题(见第7.3节)。 最后,我们观察到一个趋势,即相较于定制模型,研究者越来越倾向于采用通用语言模型(见第4节)。虽然这一趋势反映了 NLP 技术的迅速融合与发展,但进一步探索面向金融领域的专用建模策略,仍可能为金融任务带来更大的应用价值。