成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
模型微调
关注
0
综合
百科
VIP
热门
动态
论文
精华
Fine-Tuning LLMs with Fine-Grained Human Feedback on Text Spans
Arxiv
0+阅读 · 12月29日
STARE-VLA: Progressive Stage-Aware Reinforcement for Fine-Tuning Vision-Language-Action Models
Arxiv
0+阅读 · 12月23日
Iterative Tilting for Diffusion Fine-Tuning
Arxiv
0+阅读 · 12月2日
Data Valuation for LLM Fine-Tuning: Efficient Shapley Value Approximation via Language Model Arithmetic
Arxiv
0+阅读 · 12月12日
Communication-Pipelined Split Federated Learning for Foundation Model Fine-Tuning in UAV Networks
Arxiv
0+阅读 · 11月19日
Task Matrices: Linear Maps for Cross-Model Finetuning Transfer
Arxiv
0+阅读 · 12月16日
Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning
Arxiv
0+阅读 · 11月14日
Bilevel ZOFO: Efficient LLM Fine-Tuning and Meta-Training
Arxiv
0+阅读 · 12月15日
Robust Reinforcement Learning from Human Feedback for Large Language Models Fine-Tuning
Arxiv
0+阅读 · 11月17日
GMoE: Empowering LLMs Fine-Tuning via MoE Graph Collaboration
Arxiv
0+阅读 · 11月24日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top