-
阿里巴巴发布新语音模型 Qwen2-Audio,实力超越 OpenAI Whisper
近日,阿里巴巴在其 Qwen-Audio 的基础上,推出了全新的开源语音模型 Qwen2-Audio。这款模型不仅在语音识别、翻译和音频分析方面表现出色,更是在功能和性能上实现了显著提升。Qwen2-Audio 提供了基础版和指令微调版,用户可以通过语音对音频模型提问,并识别和分析内容。 比如,用户可以让某位女性说一段话,Qwen2-Audio 可以判断她的年龄或分析她的情绪;如果输入一段嘈杂的声…- 3.5k
-
宣称超过XTTS!VoiceCraft:一个支持克隆语音及修改原始音频文本的语音模型
近日,一款名为VoiceCraft的语音模型引起了业界的广泛关注。据官方宣称,该模型的性能已经超过了XTTS,这无疑为AI音频处理领域带来了新的突破。 项目地址:https://github.com/jasonppy/VoiceCraft VoiceCraft的最大亮点在于其强大的音频克隆能力。用户只需提供一段原始音频,VoiceCraft就能通过深度学习技术,复制出与原音频声音极为相似的新音频,…- 2.1k
❯
购物车
優惠
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!