成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
Claude
关注
1
综合
百科
VIP
热门
动态
论文
精华
LLM4DS: Evaluating Large Language Models for Data Science Code Generation
Arxiv
0+阅读 · 11月16日
Towards Evaluating Large Language Models for Graph Query Generation
Arxiv
0+阅读 · 11月18日
The Dawn of GUI Agent: A Preliminary Case Study with Claude 3.5 Computer Use
Arxiv
0+阅读 · 11月15日
Towards Evaluating Large Language Models for Graph Query Generation
Arxiv
0+阅读 · 11月13日
Desert Camels and Oil Sheikhs: Arab-Centric Red Teaming of Frontier LLMs
Arxiv
0+阅读 · 11月2日
Desert Camels and Oil Sheikhs: Arab-Centric Red Teaming of Frontier LLMs
Arxiv
0+阅读 · 10月31日
Sabotage Evaluations for Frontier Models
Arxiv
0+阅读 · 10月28日
VHELM: A Holistic Evaluation of Vision Language Models
Arxiv
0+阅读 · 10月24日
Gender Bias in LLM-generated Interview Responses
Arxiv
0+阅读 · 10月28日
VHELM: A Holistic Evaluation of Vision Language Models
Arxiv
0+阅读 · 10月9日
Cybench: A Framework for Evaluating Cybersecurity Capabilities and Risks of Language Models
Arxiv
0+阅读 · 10月6日
Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks
Arxiv
0+阅读 · 10月7日
An Exploratory Study on Automatic Identification of Assumptions in the Development of Deep Learning Frameworks
Arxiv
0+阅读 · 10月6日
An Exploratory Study on Automatic Identification of Assumptions in the Development of Deep Learning Frameworks
Arxiv
0+阅读 · 9月30日
Transformers, Contextualism, and Polysemy
Arxiv
0+阅读 · 9月26日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top