成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
拒绝采样
关注
0
综合
百科
VIP
热门
动态
论文
精华
Query Provenance Analysis for Robust and Efficient Query-based Black-box Attack Defense
Arxiv
0+阅读 · 5月31日
Xwin-LM: Strong and Scalable Alignment Practice for LLMs
Arxiv
0+阅读 · 5月30日
Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF under KL-Constraint
Arxiv
0+阅读 · 5月1日
SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation
Arxiv
0+阅读 · 4月22日
Error Credits: Resourceful Reasoning about Error Bounds for Higher-Order Probabilistic Programs
Arxiv
0+阅读 · 4月22日
Generative Text Steganography with Large Language Model
Arxiv
0+阅读 · 4月16日
Greedy Poisson Rejection Sampling
Arxiv
0+阅读 · 3月29日
RS-DPO: A Hybrid Rejection Sampling and Direct Preference Optimization Method for Alignment of Large Language Models
Arxiv
0+阅读 · 3月30日
Two-phase rejective sampling
Arxiv
0+阅读 · 3月3日
Optimal Budgeted Rejection Sampling for Generative Models
Arxiv
0+阅读 · 3月1日
The Importance Markov Chain
Arxiv
0+阅读 · 2月26日
The Sample Complexity of Approximate Rejection Sampling with Applications to Smoothed Online Learning
Arxiv
0+阅读 · 2月23日
Diffusion Posterior Sampling is Computationally Intractable
Arxiv
0+阅读 · 2月20日
Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF under KL-Constraint
Arxiv
0+阅读 · 2月20日
RS-DPO: A Hybrid Rejection Sampling and Direct Preference Optimization Method for Alignment of Large Language Models
Arxiv
0+阅读 · 2月15日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top