OpenAI首次展示语音生成模型Voice Engine:可复制原声

当地时间3月29日,OpenAI在官网首次展示了名为“Voice Engine”的语音生成模型。该模型正处于小规模预览阶段,可利用文本输入和单个15秒音频样本来生成与原声非常相似的自然语音。据介绍,OpenAI于2022年底首次开发出该模型,并已将其应用于其文本转语音API以及ChatGPT语音和朗读功能中的预设语音。OpenAI表示,由于合成语音被滥用的潜在风险,其将采取谨慎和知情的方式进行更广泛的发布。

搜索