模型微调论文 - 专知

会员服务 ·

模型微调

Fine-Tuning LLMs with Fine-Grained Human Feedback on Text Spans

Fine-Tuning LLMs with Fine-Grained Human Feedback on Text Spans

Arxiv

0+阅读 · 12月29日

STARE-VLA: Progressive Stage-Aware Reinforcement for Fine-Tuning Vision-Language-Action Models

Arxiv

0+阅读 · 12月23日

Iterative Tilting for Diffusion Fine-Tuning

Arxiv

0+阅读 · 12月2日

Data Valuation for LLM Fine-Tuning: Efficient Shapley Value Approximation via Language Model Arithmetic

Arxiv

0+阅读 · 12月12日

Communication-Pipelined Split Federated Learning for Foundation Model Fine-Tuning in UAV Networks

Arxiv

0+阅读 · 11月19日

Task Matrices: Linear Maps for Cross-Model Finetuning Transfer

Arxiv

0+阅读 · 12月16日

Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning

Arxiv

0+阅读 · 11月14日

Bilevel ZOFO: Efficient LLM Fine-Tuning and Meta-Training

Arxiv

0+阅读 · 12月15日

Robust Reinforcement Learning from Human Feedback for Large Language Models Fine-Tuning

Arxiv

0+阅读 · 11月17日

GMoE: Empowering LLMs Fine-Tuning via MoE Graph Collaboration

Arxiv

0+阅读 · 11月24日

参考链接

微信扫码咨询专知VIP会员