智谱清言上线情感语音模型 GLM-4-Voice：可理解情感，有情绪表达和共鸣

资讯
5 个月前

智谱清言上线情感语音模型 GLM-4-Voice：可理解情感，有情绪表达和共鸣

智谱宣布上线 GLM-4-Voice 端到端情感语音模型。官方表示，其能够理解情感，有情绪表达、情感共鸣，可自助调节语速，支持多语言和方言，并且延时更低、可随时打断，用户即日起可在“智谱清言”App 上体验。

据介绍，GLM-4-Voice 具备如下特点：

情感表达和情感共鸣：声音有不同的情感和细腻的变化，如高兴、悲伤、生气、害怕等。
调节语速：在同一轮对话中，可以要求 TA 快点说 or 慢点说。
随时打断，灵活输入指令：根据实时的用户指令，调整语音输出的内容和风格，支持更灵活的对话互动。
多语言、多方言支持：目前 GLM-4-Voice 支持中英文语音以及中国各地方言，尤其擅长粤语、重庆话、北京话等。
结合视频通话，能看也能说：即将上线视频通话功能。

此外，智谱 AutoGLM 具备 phone use 能力，只需接收简单的文字 / 语音指令，它就可以模拟人类操作手机。其不受限于简单的任务场景或 API 调用，也不需要用户手动搭建复杂繁琐的工作流，操作逻辑与人类类似。

GLM-4-Voice 同期对外开源，官方称其为智谱首个开源的端到端多模态模型。IT之家附地址：

代码仓库：

https://github.com/THUDM/GLM-4-Voice

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

智谱清言语音模型

阿尔特曼回应 OpenAI 计划推出下一代模型 Orion：假消息失控了

2024-10-26 9:53:08

Claude AI 上线新工具：分析、可视化 CSV 文件中的数据

2024-10-26 9:55:51

搜索