大型语言模型(Large Language Models, LLMs)在各类自然语言任务上取得了显著成果,近年来也积极拓展至多模态领域与资源受限环境。然而,现有方法多依赖高成本的监督式微调,或假设训练与推理条件相同,因此在面对未见模态、有限数据或计算资源受限情境时,泛化能力仍存在显著限制。

本论文系统性地探讨提升大型语言模型在现实环境中可用性的途径,聚焦于泛化能力与资源限制下的适应性。首先,提出一套以文本为中心的多模态对齐框架,将文本、图像、表格及波形等异质模态转换为自然语言描述,使模型能够通过即时提示学习(in-context learning)应对未见或动态变化的模态组合,无需重新训练。为强化模型在面对噪声或缺失模态时的鲁棒性,本文亦设计出对抗式提示(adversarial prompting)技术,在提示层级生成语义挑战性高的扰动数据,以提升模型韧性。

除多模态对齐外,论文亦探讨推理阶段的优化策略,透过提示搜索与不确定性量化,在无需额外训练的情况下提升模型效能,提供相较于传统扩大参数规模或重新训练之外的另一种高效路径。同时,本研究针对资源稀缺领域,如 Verilog 程序代码生成,设计出具有正确性保证的合成数据生成流程及逻辑增强型推理模型,在有限数据条件下达成最新最佳表现。

综合上述,本文提出的方法在对齐、优化与合成数据生成三大方面,皆展现了在不同模态、资源限制与应用场景下,显著提升大型语言模型适用性、扩展性与效率的潜力。

关键词:大型语言模型、多模态对齐、代码生成、推理模型、提示词优化、推理阶段扩展、语言不确定性、硬件描述语言、Verilog

成为VIP会员查看完整内容
5

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
大语言模型与小语言模型协同机制综述
专知会员服务
30+阅读 · 5月15日
多模态基础模型的机制可解释性综述
专知会员服务
36+阅读 · 2月28日
迈向大语言模型偏好学习的统一视角综述
专知会员服务
23+阅读 · 2024年9月7日
【KDD2024】面向鲁棒推荐的决策边界感知图对比学习
专知会员服务
21+阅读 · 2024年8月8日
大型语言模型的高效提示方法综述
专知会员服务
74+阅读 · 2024年4月2日
专知会员服务
80+阅读 · 2021年5月30日
专知会员服务
36+阅读 · 2020年11月29日
综述| 当图神经网络遇上强化学习
图与推荐
34+阅读 · 2022年7月1日
综述:基于GAN的图像翻译模型盘点
GAN生成式对抗网络
21+阅读 · 2019年9月2日
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
464+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
18+阅读 · 2021年3月16日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
Arxiv
10+阅读 · 2020年11月26日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
10+阅读 · 2018年3月22日
VIP会员
相关VIP内容
大语言模型与小语言模型协同机制综述
专知会员服务
30+阅读 · 5月15日
多模态基础模型的机制可解释性综述
专知会员服务
36+阅读 · 2月28日
迈向大语言模型偏好学习的统一视角综述
专知会员服务
23+阅读 · 2024年9月7日
【KDD2024】面向鲁棒推荐的决策边界感知图对比学习
专知会员服务
21+阅读 · 2024年8月8日
大型语言模型的高效提示方法综述
专知会员服务
74+阅读 · 2024年4月2日
专知会员服务
80+阅读 · 2021年5月30日
专知会员服务
36+阅读 · 2020年11月29日
相关基金
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
相关论文
A Survey of Large Language Models
Arxiv
464+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
18+阅读 · 2021年3月16日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
Arxiv
10+阅读 · 2020年11月26日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Arxiv
10+阅读 · 2018年3月22日
微信扫码咨询专知VIP会员