Large Language Models (LLMs), consisting of 100 billion or more parameters, have demonstrated remarkable ability in complex multi-step reasoning tasks. However, the application of such generic advancements has been limited to a few fields, such as clinical or legal, with the field of financial reasoning remaining largely unexplored. To the best of our knowledge, the ability of LLMs to solve financial reasoning problems has never been dealt with, and whether it can be performed at any scale remains unknown. To address this knowledge gap, this research presents a comprehensive investigation into the potential application of LLMs in the financial domain. The investigation includes a detailed exploration of a range of subjects, including task formulation, synthetic data generation, prompting methods, and evaluation capability. Furthermore, the study benchmarks various GPT variants with parameter scales ranging from 2.8B to 13B, with and without instruction tuning, on diverse dataset sizes. By analyzing the results, we reveal that the ability to generate coherent financial reasoning first emerges at 6B parameters, and continues to improve with better instruction-tuning or larger datasets. Additionally, the study provides a publicly accessible dataset named sFIOG (Synthetic-Financial Investment Opinion Generation), consisting of 11,802 synthetic investment thesis samples, to support further research in the field of financial reasoning. Overall, this research seeks to contribute to the understanding of the efficacy of language models in the field of finance, with a particular emphasis on their ability to engage in sophisticated reasoning and analysis within the context of investment decision-making.


翻译:大型语言模型(LLM)由1000亿个或更多参数组成,在复杂的多步推理任务中表现出了remarkable的能力。然而,这种通用进展的应用被限制在少数领域,如临床或法律领域,而金融推理领域仍然几乎未被开发。据我们所知,LLM在解决金融推理问题方面的能力从未被研究过,是否可以在任何规模上执行仍然不为人知。为了填补这一知识空白,本研究对LLM在金融领域的潜在应用进行了全面调查。调查包括对一系列主题的详细探索,包括任务制定、合成数据生成、提示方法和评估能力。此外,该研究比较了各种GPT变体,参数规模从2.8B到13B不等,带有或不带有指令调整,在不同的数据集大小上进行了基准测试。通过分析结果,我们发现6B参数是生成连贯金融推理的能力首次出现的阈值,并且随着更好的指令调整或更大的数据集而不断改进。此外,该研究提供了一个名为sFIOG(合成金融投资意见生成)的公开数据集,其中包含11,802个合成投资论文样本,以支持在金融推理领域进一步研究。总的来说,这项研究旨在为金融领域中语言模型的有效性做出贡献,特别强调了它们在投资决策的背景下进行复杂推理和分析的能力。

3
下载
关闭预览

相关内容

在社会经济生活,银行、证券或保险业者从市场主体募集资金,并投资给其它市场主体的经济活动。
「知识增强预训练语言模型」最新研究综述
专知会员服务
58+阅读 · 2022年11月18日
自然语言处理顶会NAACL2022最佳论文出炉!
专知会员服务
41+阅读 · 2022年6月30日
知识增强预训练语言模型:全面综述
专知会员服务
87+阅读 · 2021年10月19日
专知会员服务
32+阅读 · 2021年10月9日
零样本文本分类,Zero-Shot Learning for Text Classification
专知会员服务
95+阅读 · 2020年5月31日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
161+阅读 · 2020年3月18日
「知识增强预训练语言模型」最新研究综述
专知
17+阅读 · 2022年11月18日
金融领域自然语言处理研究资源大列表
专知
13+阅读 · 2020年2月27日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
综述 | 事件抽取及推理 (上)
开放知识图谱
87+阅读 · 2019年1月9日
年度必读:2018最具突破性人工智能论文Top 10
机器学习算法与Python学习
11+阅读 · 2018年12月2日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2023年6月14日
A Survey of Large Language Models
Arxiv
326+阅读 · 2023年3月31日
Arxiv
15+阅读 · 2022年1月24日
Arxiv
11+阅读 · 2018年10月17日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员