成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
Anthropic
关注
0
综合
百科
VIP
热门
动态
论文
精华
Toward Democracy Levels for AI
Arxiv
0+阅读 · 11月14日
Benchmarking Floworks against OpenAI & Anthropic: A Novel Framework for Enhanced LLM Function Calling
Arxiv
0+阅读 · 10月23日
Sabotage Evaluations for Frontier Models
Arxiv
0+阅读 · 10月28日
Jailbreaking LLMs with Arabic Transliteration and Arabizi
Arxiv
0+阅读 · 10月3日
Mapping Technical Safety Research at AI Companies: A literature review and incentives analysis
Arxiv
0+阅读 · 9月12日
Overcoming Reward Overoptimization via Adversarial Policy Optimization with Lightweight Uncertainty Estimation
Arxiv
0+阅读 · 7月9日
Public Constitutional AI
Arxiv
0+阅读 · 6月24日
Self and Cross-Model Distillation for LLMs: Effective Methods for Refusal Pattern Alignment
Arxiv
0+阅读 · 6月17日
Killer Apps: Low-Speed, Large-Scale AI Weapons
Arxiv
1+阅读 · 6月17日
Identification of Stone Deterioration Patterns with Large Multimodal Models
Arxiv
0+阅读 · 6月5日
Backdoor Removal for Generative Large Language Models
Arxiv
0+阅读 · 5月13日
Octopus v4: Graph of language models
Arxiv
0+阅读 · 4月30日
From LLM to NMT: Advancing Low-Resource Machine Translation with Claude
Arxiv
0+阅读 · 4月22日
Learn Your Reference Model for Real Good Alignment
Arxiv
0+阅读 · 4月15日
Risk and Response in Large Language Models: Evaluating Key Threat Categories
Arxiv
0+阅读 · 3月22日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top