近期大型语言模型(LLMs)的进步为金融领域的人工智能应用开启了新的可能性。在这篇论文中,我们提供了一项实用的综述,重点关注利用LLMs进行金融任务的两个关键方面:现有解决方案和采纳指南。 首先,我们回顾了当前在金融领域使用LLMs的方法,包括通过零次学习或少次学习利用预训练模型、针对特定领域数据的微调,以及从头开始训练定制LLMs。我们总结了关键模型,并评估了它们在金融自然语言处理任务上的性能提升。 其次,我们提出了一个决策框架,以指导金融专业人士根据他们的用例约束(围绕数据、计算和性能需求)选择合适的LLM解决方案。该框架提供了从轻量级实验到定制LLMs的重投资的途径。 最后,我们讨论了在金融应用中利用LLMs的限制和挑战。总体而言,这项综述旨在综合最新技术,并为负责任地将LLMs应用于推进金融AI提供路线图。 人工智能的最新进展,尤其是在自然语言处理方面,导致了像ChatGPT[33]这样的强大大型语言模型(LLMs)的发展。这些模型在理解、生成和推理自然语言方面展示了令人印象深刻的能力。金融行业可以从应用LLMs中受益,因为有效的语言理解和生成可以帮助交易、风险建模、客户服务等领域。 在这项综述中,我们旨在提供一个关注于利用LLMs进行金融应用的两个关键方面的实用概览: * 利用LLMs进行各种金融任务的现有解决方案和模型。我们总结了关键技术,如微调预训练LLMs和从头开始训练领域特定LLMs。 * 关于在金融中应用LLMs的决策过程的指导。我们讨论了关于LLMs是否适合某项任务的考虑因素,成本/效益权衡、风险和限制。
通过回顾当前文献和发展,我们希望提供一种易于理解的最新技术综合,以及在金融中采用LLMs的考虑因素。这项综述面向金融专业人士和探索AI与金融交叉领域的研究人员。它也可能为为金融行业应用LLM解决方案的开发者提供信息。 本文的其余部分组织如下。第2节涵盖了语言建模的背景和导致LLMs的最新进展。第3节调查了金融中当前的AI应用及LLMs在这些领域的发展潜力。第4节和第5节提供了金融应用的LLM解决方案和决策指导。最后,第6节和第7节讨论了风险、限制和结论。