成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
强化微调
关注
0
综合
百科
VIP
热门
动态
论文
精华
精品内容
北交大团队开源代码生成框架o1-Coder,并将推出强化微调RFT版本
专知会员服务
24+阅读 · 12月10日
从监督微调SFT到强化微调RFT,逐渐补齐推理模型的技术拼图
专知会员服务
21+阅读 · 12月7日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top