成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
GPT-5
关注
0
综合
百科
VIP
热门
动态
论文
精华
Benchmarking GPT-5 for biomedical natural language processing
Arxiv
0+阅读 · 10月23日
From Charts to Code: A Hierarchical Benchmark for Multimodal Models
Arxiv
0+阅读 · 10月20日
The GPT-4o Shock Emotional Attachment to AI Models and Its Impact on Regulatory Acceptance: A Cross-Cultural Analysis of the Immediate Transition from GPT-4o to GPT-5
Arxiv
0+阅读 · 10月18日
MAGPIE: A benchmark for Multi-AGent contextual PrIvacy Evaluation
Arxiv
0+阅读 · 10月16日
Toward LLM-Supported Automated Assessment of Critical Thinking Subskills
Arxiv
0+阅读 · 10月14日
DocReward: A Document Reward Model for Structuring and Stylizing
Arxiv
0+阅读 · 10月13日
Holistic Evaluation of Multimodal LLMs on Spatial Intelligence
Arxiv
0+阅读 · 10月13日
GPT-5 Model Corrected GPT-4V's Chart Reading Errors, Not Prompting
Arxiv
0+阅读 · 10月8日
Winning Gold at IMO 2025 with a Model-Agnostic Verification-and-Refinement Pipeline
Arxiv
0+阅读 · 9月30日
Towards Reliable Benchmarking: A Contamination Free, Controllable Evaluation Framework for Multi-step LLM Function Calling
Arxiv
0+阅读 · 9月30日
Performance of GPT-5 in Brain Tumor MRI Reasoning
Arxiv
0+阅读 · 8月14日
Capabilities of GPT-5 on Multimodal Medical Reasoning
Arxiv
0+阅读 · 8月11日
Capabilities of GPT-5 on Multimodal Medical Reasoning
Arxiv
0+阅读 · 8月13日
Beyond GPT-5: Making LLMs Cheaper and Better via Performance-Efficiency Optimized Routing
Arxiv
0+阅读 · 8月18日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top