阶跃星辰在公众号宣布推出 Step-1o 千亿参数端到端语音大模型,据称是“国内首个千亿参数端到端语音大模型”。
据阶跃星辰介绍,传统的语音模型采用级联方案,用户输入的语音信息需要先转化为文本,再二次转化成语音输出,这个过程不仅会降低传输效率、更会在过程中折损掉包括情绪在内的信息,导致语音模型时延长反应慢、回答质量和智能水平不足、情感表达空洞刻板的缺陷。但端到端的语音方案,可以实现语音理解和生成的一体化,提升模型智商和情商的上限。
1AI从官方介绍获悉,Step-1o 支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征;
Step-1o 能够通过自学和模仿不断提升回复质量,既能提供解决问题的专业建议,也能作为提供高情绪价值的陪伴。此外,Step-1o 还传承了阶跃星辰语言大模型的创作能力。
阶跃星辰透露,近期,Step-1o 将接入跃问 App 端,为用户提供实时语音通话服务。