成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
强化微调
关注
1
综合
百科
VIP
热门
动态
论文
精华
精品内容
人工智能专题:OpenAI发布会梳理
专知会员服务
37+阅读 · 2024年12月24日
o3压轴登场,下一步是领域泛化! 北交大桑基韬团队发布首个强化微调的技术报告并开源代码:仅用100个样本,领域推理能力提升11%
专知会员服务
24+阅读 · 2024年12月22日
北交大团队开源代码生成框架o1-Coder,并将推出强化微调RFT版本
专知会员服务
29+阅读 · 2024年12月10日
从监督微调SFT到强化微调RFT,逐渐补齐推理模型的技术拼图
专知会员服务
27+阅读 · 2024年12月7日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top