成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
GPT-4o
关注
1
GPT-4o(“o”代表“omni”)朝着更自然的人机交互迈出了一步——它可以接受任何组合的文本、音频和图像作为输入,并生成任何组合的文本、音频和图像输出。它对音频输入的响应时间最短可达232毫秒,平均为320毫秒,这与人类在对话中的响应时间相似。在英语文本和代码处理上,它的性能与GPT-4 Turbo相当,但在非英语文本处理方面有显著改进,同时在API中速度更快且成本降低50%。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。
综合
百科
VIP
热门
动态
论文
精华
Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study
Arxiv
0+阅读 · 8月26日
Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study
Arxiv
0+阅读 · 9月2日
Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study
Arxiv
0+阅读 · 8月28日
Detection Made Easy: Potentials of Large Language Models for Solidity Vulnerabilities
Arxiv
0+阅读 · 9月15日
Dialogue You Can Trust: Human and AI Perspectives on Generated Conversations
Arxiv
0+阅读 · 9月10日
Towards a Realistic Long-Term Benchmark for Open-Web Research Agents
Arxiv
0+阅读 · 9月23日
AlignBot: Aligning VLM-powered Customized Task Planning with User Reminders Through Fine-Tuning for Household Robots
Arxiv
0+阅读 · 9月18日
Small Language Models can Outperform Humans in Short Creative Writing: A Study Comparing SLMs with Humans and LLMs
Arxiv
0+阅读 · 9月17日
A Study on Zero-shot Non-intrusive Speech Assessment using Large Language Models
Arxiv
0+阅读 · 9月16日
ExpLLM: Towards Chain of Thought for Facial Expression Recognition
Arxiv
0+阅读 · 9月4日
Have Large Vision-Language Models Mastered Art History?
Arxiv
0+阅读 · 9月5日
'Since Lawyers are Males..': Examining Implicit Gender Bias in Hindi Language Generation by LLMs
Arxiv
0+阅读 · 9月20日
Can You Trust Your Metric? Automatic Concatenation-Based Tests for Metric Validity
Arxiv
0+阅读 · 8月22日
DocMath-Eval: Evaluating Math Reasoning Capabilities of LLMs in Understanding Long and Specialized Documents
Arxiv
0+阅读 · 8月8日
DocMath-Eval: Evaluating Math Reasoning Capabilities of LLMs in Understanding Long and Specialized Documents
Arxiv
0+阅读 · 8月9日
参考链接
https://openai.com/index/hello-gpt-4o/
父主题
GPT-4
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top