前沿的人工智能(AI)技术不断重塑我们对世界的认知。例如,基于大语言模型(LLMs)的应用(如 ChatGPT)已经展现出在广泛主题上生成类人对话的能力。由于其在多种语言相关任务(如开放域问答、翻译和文档摘要)上取得的卓越表现,人们可以预见 LLMs 在更广泛的现实应用中(如客户服务、教育与无障碍支持以及科学发现)将带来的深远影响。受到这些成功的启发,本文将对最新的大语言模型及其在各学术学科中的融合进行综述,涵盖:(1) 人文、文学与法律(如历史、哲学、政治学、艺术与建筑、法律),(2) 经济与商业(如金融、经济学、会计、市场营销),以及 (3) 科学与工程(如数学、物理与机械工程、化学与化学工程、生命科学与生物工程、地球科学与土木工程、计算机科学与电子工程)。通过融汇人文与技术,本文将探讨 LLMs 如何塑造这些领域的研究与实践,并进一步讨论在生成式 AI 时代所面临的关键局限、开放挑战与未来方向。对 LLMs 在不同学科中的应用综述——以及由此得出的关键观察与洞见——能够为有意利用 LLMs 推动其工作在多样化现实场景中发展的研究人员和实践者提供参考。
当今,前沿的人工智能(AI)技术正在不断重塑我们对世界的认知。例如,基于生成式预训练 Transformer(GPT)架构的基础语言模型 ChatGPT [1],已经展现出在广泛主题上生成类人对话的能力,使其成为增长最快的应用程序(即在上线后的前两个月内用户数突破 1 亿)[2]。尽管其在鲁棒性与真实性方面仍存在局限,但凭借在多种语言相关任务(如开放域问答、翻译和文档摘要)上的卓越表现,ChatGPT 展示出在客户服务、个人助理以及医学诊断等多样化场景中的潜在应用价值。除了自然语言处理(NLP)领域的 ChatGPT 等模型外,计算机视觉(CV)中的预训练基础模型(如 Florence/Florence-2 [3] 与 Qwen2.5-VL)也在目标检测、图像分割、视频推理等多项视觉任务上取得了最先进水平,使其在面部识别、医学图像分析以及自动驾驶等应用中展现出显著价值。这种跨模态的融合进一步凸显了大语言模型(LLMs)的关键作用——它们不仅为表征学习和推理提供了统一框架,也成为嵌入其他模态的核心支柱,从而在 AI 驱动的科研与应用生态系统中居于中心地位。 受这些最新进展的启发,本文将综述前沿的大语言模型及其在多个学术学科中的应用整合,涵盖:(1) 人文、文学与法律(历史、哲学、政治学、艺术与建筑、法律),(2) 经济与商业(金融、经济学、会计、市场营销),以及 (3) 科学与工程(数学、物理与机械工程、化学与化学工程、生命科学与生物工程、地球科学与土木工程、计算机科学与电子工程)。作为人文探索与技术发展的交汇点,本文旨在探讨 LLMs 如何重塑各领域的研究工作流与专业实践,并进一步梳理其所面临的主要局限、未解挑战以及在生成式 AI 时代的未来发展方向。通过综合跨学科的应用并提炼关键洞见,本综述期望为希望利用 LLMs 推动现实应用研究与实践的学者与从业者提供指导。 基于近期突破,本文在第 2 章中首先介绍 LLM 的基本概念与评估方法。我们从精确定义与简要发展历史入手,进而通过概览和重点剖析主流模型家族——包括 GPT 系列、OpenAI 推理模型、Claude 3、Gemini 2、Grok、Llama 3、Qwen 2 和 DeepSeek——来绘制前沿图谱,突出其设计选择与功能特点。随后,我们讨论评估维度:涵盖核心任务类型、代表性基准数据集与常用方法,并给出性能综述,以期为理解模型表现与方法选择提供背景、比较图景与实践指南。 在三个学科群组(人文、文学与法律;经济与商业;科学与工程)中,我们首先通过综述其主要研究任务与传统方法来引入学科背景,强调其关键贡献与重要影响。接着,我们识别可由 AI 尤其是 LLMs 辅助解决的共性研究挑战,并提出一个任务分类体系,将学科研究与 LLMs 相结合:既保持学科相关性,又在算法层面确保一致性,以支持模型开发、基准评测与比较分析。在每个类别中,我们回顾现有的 LLM 驱动的研究与应用,探讨其局限,并展望未来研究方向。最后,我们总结代表性基准与关键讨论。 在第 3 章中,我们调研 LLMs 如何正在改变人文学科与法律领域,从证据到实践展开。在历史学中,我们涵盖叙事生成与分析、定量与科学方法(如历史心理反应的模拟),以及跨学科研究,并结合基准讨论。在哲学中,我们回顾规范与解释性应用(如辩论/对话生成)、分析与逻辑应用(如符号落地诊断),以及跨学科研究。政治学部分,我们考察政策洞察的文本分析、意见模拟与预测、政治信息生成与框架化,并附带基准与反思。艺术与建筑部分,我们综述模型辅助的视觉、文学、表演艺术创作,以及基于 LLM 的建筑设计与分析,并总结评估与经验。最后,在法律部分,我们覆盖法律问答、合同与文书撰写、法律文档理解与案例分析、判决预测,并附以基准与讨论。 在第 4 章中,我们综述 LLMs 在经济与商业中的应用。在金融领域,我们涵盖交易与投资研究、公司金融、市场分析、金融中介与风险管理、可持续金融、金融科技及相关基准。在经济学中,我们涉及行为与实验研究、宏观经济模拟与基于智能体的建模、博弈论与战略互动、经济推理与知识表征,并配套评估。在会计部分,我们审视审计、财务与管理会计、税务,并总结基准。在市场营销部分,我们涵盖消费者洞察与行为分析、内容生成与活动设计、市场情报与趋势分析,同样附带性能基准。 在第 5 章中,我们系统回顾 LLMs 在科学与工程中的应用。数学部分包括定理证明辅助、理论探索与模式识别、数学教育与相关基准。物理与机械工程部分涵盖文档任务、设计构思与参数化制图、仿真支持与建模接口、多模态实验解读、交互式推理,并附以评估与讨论。化学与化学工程部分包括分子结构与反应推理、性质预测、材料优化、实验映射、分子设计、反应数据组织,并比较不同基准。生命科学与生物工程部分涵盖基因组序列分析、临床结构化数据整合、生物医学推理与理解、混合结果预测,并特别关注验证标准。地球科学与土木工程部分包括地理空间与环境数据任务、仿真与物理建模、文档处理、监测与预测性维护、设计与规划,并总结基准。最后,在计算机科学与电子工程部分,我们综述代码生成与调试、大规模代码库分析、硬件描述语言生成、功能验证、高层综合,并附以专用基准与挑战讨论。 在第 6 章中,我们以“把握当下,塑造未来”为题进行总结,综合跨领域证据,概述新兴前沿,归纳人文学科与法律、经济与商业、科学与工程三个领域的共性机遇、局限与范式,并提出未来路线:包括基于模式对齐的多模态融合与可溯源归因、受限条件下的工具增强计算、规则约束的可复现智能体仿真、时间—因果适应、带不确定性控制的决策支持、人机协作监督与治理、以及面向教育的能力建设与安全嵌入——从而提供一个可实践、可审计、可扩展的跨学科应用蓝图。 综上,本文从基础与评估到跨学科应用,系统勾勒出 LLM 研究与应用的全景,展示了当下的有效方法、尚存的脆弱环节以及进展的衡量方式。读者可以获得通用的任务分类体系、模型与工具选择的指导、严谨评估与基准构建的方法,以及在效用、安全、合规与人类监督之间取得平衡的实践模式。尽管本文不可能穷尽所有视角,且某些观点仍有待讨论,但随着 AI 技术尤其是生成式 AI 的快速发展,相关学科必将持续演进。作为初步努力,本综述希望帮助读者识别有前景的问题表述、设计合理的评估方案、预估潜在影响、并预判可能的失败模式。我们期望该综合性工作能够为研究人员、从业者与政策制定者提供借鉴,以负责任地把握当下,并塑造一个 LLMs 能够在广泛学科中实现可靠、可审计与真正有用能力的未来。