OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式，可提供更自然实时对话

当地时间 30 日，OpenAI 宣布即日起向部分 ChatGPT Plus 用户开放 GPT-4o 的语音模式（Alpha 版本），并将于今年秋季逐步推广至所有 ChatGPT Plus 订阅用户。

今年 5 月，OpenAI 首席技术官米拉・穆拉蒂（Mira Murati）在演讲中提到：

在 GPT-4o 中，我们训练了跨文本、视觉和音频的端到端全新统一模型，这意味着所有输入和输出都由同一个神经网络处理。

由于 GPT-4o 是我们第一个结合所有这些模式的模型，因此我们在探索该模型的功能及其局限性方面仍处于起步阶段。

OpenAI 公司原计划今年 6 月底邀请一小部分 ChatGPT Plus 用户测试 GPT-4o 语音模式，但官方在 6 月宣布推迟，表示需要更多时间打磨该模型，提高该模型检测和拒绝某些内容的能力。

根据此前曝光的信息，GPT-3.5 模型的平均语音反馈延迟为 2.8 秒，而 GPT-4 模型的延迟为 5.4 秒，因此在语音交流方面不太优秀，而即将推出的 GPT-4o 可以极大地缩短延迟时间，近乎无缝对话。

GPT-4o 语音模式具有快速反应、声音堪比真人等特征，OpenAI 更称 GPT-4o 语音模式可以感知语音中的情感语调，包括悲伤、兴奋或歌唱。

OpenAI 发言人林赛・麦卡勒姆（Lindsay McCallum）表示：“ChatGPT 不能假冒他人的声音，包括个人和公众人物的声音，并且会阻止与预设声音不同的输出。”

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式，可提供更自然实时对话

Meta 叫停明星 AI 聊天机器人，转向用户自制 AI

京东云八大 AI 产品发布，编程助手 JoyCoder、言犀数字人 3.0 等

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

Meta 叫停明星 AI 聊天机器人，转向用户自制 AI

京东云八大 AI 产品发布，编程助手 JoyCoder、言犀数字人 3.0 等

OpenAI GPT-4o 推动 ChatGPT 订阅服务需求激增，移动端营收暴涨

OpenAI 同意从首席执行官 Sam Altman 个人投资的初创公司 Rain 购买 5100 万美元的 AI 芯片

OpenAI图像生成器DALL-E2停止服务，DALL-E3接替其位置

OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注