-
智谱清言上线情感语音模型 GLM-4-Voice:可理解情感,有情绪表达和共鸣
智谱宣布上线 GLM-4-Voice 端到端情感语音模型。官方表示,其能够理解情感,有情绪表达、情感共鸣,可自助调节语速,支持多语言和方言,并且延时更低、可随时打断,用户即日起可在“智谱清言”App 上体验。 据介绍,GLM-4-Voice 具备如下特点: 情感表达和情感共鸣:声音有不同的情感和细腻的变化,如高兴、悲伤、生气、害怕等。 调节语速:在同一轮对话中,可以要求 TA 快点说 or 慢点说…- 3k
-
阿里巴巴发布新语音模型 Qwen2-Audio,实力超越 OpenAI Whisper
近日,阿里巴巴在其 Qwen-Audio 的基础上,推出了全新的开源语音模型 Qwen2-Audio。这款模型不仅在语音识别、翻译和音频分析方面表现出色,更是在功能和性能上实现了显著提升。Qwen2-Audio 提供了基础版和指令微调版,用户可以通过语音对音频模型提问,并识别和分析内容。 比如,用户可以让某位女性说一段话,Qwen2-Audio 可以判断她的年龄或分析她的情绪;如果输入一段嘈杂的声…- 5.3k
-
宣称超过XTTS!VoiceCraft:一个支持克隆语音及修改原始音频文本的语音模型
近日,一款名为VoiceCraft的语音模型引起了业界的广泛关注。据官方宣称,该模型的性能已经超过了XTTS,这无疑为AI音频处理领域带来了新的突破。 项目地址:https://github.com/jasonppy/VoiceCraft VoiceCraft的最大亮点在于其强大的音频克隆能力。用户只需提供一段原始音频,VoiceCraft就能通过深度学习技术,复制出与原音频声音极为相似的新音频,…- 2.6k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!