OpenAI 正在为其流行的语言模型 ChatGPT 部署一项特别的新功能,该功能将使其能够进行类似电话通话的交互。这一更新预计将在周一的某个活动中公布。
为了实现这一功能,OpenAI 已经部署了必要的 WebRTC(Web Real-Time Communication)服务器。尽管最初人们认为 WebRTC 仅用于 ChatGPT 的语音模式,但后来发现实际上是通过 Livekit 这一流媒体服务来实现的。
新功能的主要特点包括:
- 直接语音对话:用户将能够在 ChatGPT 的界面上直接通过语音与其进行对话,类似于传统电话通话。
- 增强的互动性:这种新交互方式可能使 ChatGPT 更加互动和实用,为用户提供更丰富的沟通体验。
- 语音到文本的转换:目前 ChatGPT 支持的语音功能主要是将用户的语音输入转换为文本,然后以文本形式回复。
- 实时语音交流:整合电话通话功能意味着 OpenAI 可能在扩展到更直接的语音交流,允许用户和 ChatGPT 进行实时的语音对话。
- 无需屏幕的交流:新的语音对话功能将模拟真实的电话对话,使用户能够在不查看屏幕的情况下与 ChatGPT 进行交流,提高便利性。
OpenAI 的这一创新尝试将 ChatGPT 的应用范围扩展到了更直接的语音交流领域,预示着未来人机交互可能会更加自然和流畅。