RLAIF论文 - 专知

会员服务 ·

RLAIF

Enhancing Reasoning Skills in Small Persian Medical Language Models Can Outperform Large-Scale Data Training

Enhancing Reasoning Skills in Small Persian Medical Language Models Can Outperform Large-Scale Data Training

Arxiv

0+阅读 · 10月30日

RLAIF-SPA: Optimizing LLM-based Emotional Speech Synthesis via RLAIF

Arxiv

0+阅读 · 10月16日

Optimization-based Prompt Injection Attack to LLM-as-a-Judge

Arxiv

0+阅读 · 3月3日

Training Dialogue Systems by AI Feedback for Improving Overall Dialogue Impression

Arxiv

0+阅读 · 1月22日

Optimization-based Prompt Injection Attack to LLM-as-a-Judge

Arxiv

0+阅读 · 2024年11月15日

PopAlign: Diversifying Contrasting Patterns for a More Comprehensive Alignment

Arxiv

0+阅读 · 2024年10月17日

RLAIF vs. RLHF: Scaling Reinforcement Learning from Human Feedback with AI Feedback

Arxiv

0+阅读 · 2024年9月3日

Optimization-based Prompt Injection Attack to LLM-as-a-Judge

Arxiv

0+阅读 · 2024年8月24日

A Comprehensive Survey of LLM Alignment Techniques: RLHF, RLAIF, PPO, DPO and More

Arxiv

0+阅读 · 2024年7月23日

Applying RLAIF for Code Generation with API-usage in Lightweight LLMs

Arxiv

0+阅读 · 2024年6月28日

参考链接

微信扫码咨询专知VIP会员