成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
GPT-4o
关注
1
GPT-4o(“o”代表“omni”)朝着更自然的人机交互迈出了一步——它可以接受任何组合的文本、音频和图像作为输入,并生成任何组合的文本、音频和图像输出。它对音频输入的响应时间最短可达232毫秒,平均为320毫秒,这与人类在对话中的响应时间相似。在英语文本和代码处理上,它的性能与GPT-4 Turbo相当,但在非英语文本处理方面有显著改进,同时在API中速度更快且成本降低50%。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。
综合
百科
VIP
热门
动态
论文
精华
计算机行业深度:从技术路径,纵观国产大模型逆袭之路
专知会员服务
37+阅读 · 7月6日
计算机行业深度:从技术路径,纵观国产大模型逆袭之路
专知会员服务
12+阅读 · 7月6日
GPT-4o发布,关注强交互场景落地
专知会员服务
30+阅读 · 5月15日
GPT-4o:大模型风向标,OpenAI 重大更新
专知会员服务
44+阅读 · 5月14日
OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代
专知会员服务
46+阅读 · 5月14日
参考链接
https://openai.com/index/hello-gpt-4o/
父主题
GPT-4
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top