OpenAI全能模型GPT-4o发布能听能看能说还免费

OpenAI 最新发布了其旗舰大模型 GPT-4o，该模型不仅免费可用，还具备听、看、说的综合能力，提供丝滑流畅且无延迟的交互体验，仿佛与人进行视频通话一般。

GPT-4o 的特点

全能输入输出:GPT-4o 能够接受文本、音频和图像的任意组合作为输入，并生成相应的文本、音频和图像输出。
快速响应:该模型响应音频输入的时间仅为232毫秒至320毫秒，与人类对话反应速度一致。
免费开放:GPT-4o 将对所有用户免费开放，包括 ChatGPT Plus 会员版所有的功能，如视觉、联网、记忆、执行代码等。

在直播中，CTO Murati 展示了 GPT-4o 的实时互动能力，包括随时打断对话并用丰富语气进行回复。

研究员 William Fedus 透露，GPT-4o 是之前在大模型竞技场中进行 A/B 测试的模型之一，性能高于 GPT-4-Turbo。

API 提供

GPT-4o 也将提供 API，价格为五折，速度提升一倍，单位时间内的调用次数是原来的五倍。

网友们已经在设想 GPT-4o 的应用场景，比如帮助盲人或弱视人士更好地理解世界。

演示亮点

OpenAI 总裁 Brockman 在直播中演示了 GPT-4o 的实时翻译能力，以及两个 ChatGPT 之间的对话和歌唱。

技术细节

GPT-4o 是一个端到端训练的新模型，所有输入和输出都由同一个神经网络处理，这比之前的语音模式有显著改进。

未来展望

尽管 OpenAI 没有发布详细的技术报告，但 GPT-4o 的成功演示已经引起了广泛关注和讨论。

OpenAI 的 GPT-4o 模型的发布，不仅展示了公司在 AI 领域的最新进展，也为公众提供了一个功能强大且易于使用的 AI 工具。随着技术的不断进步，我们可以期待 GPT-4o 在未来将带来更加丰富和创新的应用场景。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

OpenAI全能模型GPT-4o发布能听能看能说还免费

OpenAI 创投基金继续扩大规模支持多家人工智能初创公司

锤子便签iOS版更新v4.0：新增AI写作功能一年88.8元

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

OpenAI 创投基金继续扩大规模 支持多家人工智能初创公司

锤子便签iOS版更新v4.0：新增AI写作功能 一年88.8元

OpenAI重磅发布全能模型GPT-4o，免费开放给所有用户使用！

OpenAI GPT-4o 推动 ChatGPT 订阅服务需求激增，移动端营收暴涨

OpenAI 竞争对手 Anthropic 发布其最强 AI 大模型 Claude 3.5

OpenAI开放新模型gpt-4o-64k-output-alpha，GPT-4o API最长可支持 64K 输出

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

OpenAI 创投基金继续扩大规模支持多家人工智能初创公司

锤子便签iOS版更新v4.0：新增AI写作功能一年88.8元