成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
Self-Play
关注
0
综合
百科
VIP
热门
动态
论文
精华
SPIRAL: Self-Play Incremental Racing Algorithm for Learning in Multi-Drone Competitions
Arxiv
0+阅读 · 10月26日
Curriculum-Based Iterative Self-Play for Scalable Multi-Drone Racing
Arxiv
0+阅读 · 10月26日
Multi-Agent Evolve: LLM Self-Improve through Co-evolution
Arxiv
0+阅读 · 10月27日
SPACeR: Self-Play Anchoring with Centralized Reference Models
Arxiv
0+阅读 · 10月20日
Search Self-play: Pushing the Frontier of Agent Capability without Supervision
Arxiv
0+阅读 · 10月21日
CooT: Learning to Coordinate In-Context with Coordination Transformers
Arxiv
0+阅读 · 10月18日
LLMs Judge Themselves: A Game-Theoretic Framework for Human-Aligned Evaluation
Arxiv
0+阅读 · 10月17日
Absolute Zero: Reinforced Self-play Reasoning with Zero Data
Arxiv
0+阅读 · 10月16日
Offline Fictitious Self-Play for Competitive Games
Arxiv
0+阅读 · 10月14日
MADS: Multi-Agent Dialogue Simulation for Diverse Persuasion Data Generation
Arxiv
0+阅读 · 10月11日
Beyond Survival: Evaluating LLMs in Social Deduction Games with Human-Aligned Strategies
Arxiv
0+阅读 · 10月13日
MADS: Multi-Agent Dialogue Simulation for Diverse Persuasion Data Generation
Arxiv
0+阅读 · 9月30日
Chasing Moving Targets with Online Self-Play Reinforcement Learning for Safer Language Models
Arxiv
0+阅读 · 10月6日
AceSearcher: Bootstrapping Reasoning and Search for LLMs via Reinforced Self-Play
Arxiv
0+阅读 · 9月29日
SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning
Arxiv
0+阅读 · 7月1日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top