AI音频模型

Seed-TTS：字节推出的语音生成模型，可生成媲美人类的语音

Seed-TTS是一款高质量、多功能的语音生成模型，能够生成几乎与人类语音无法区分的语音。它具有出色的语音控制能力，能够生成具有情感的、多样化的语音，适用于多种场景。 Seed-TTS功能零-shot语境学习：能够在不同语境下生成自然流畅的语音。说话人微调：支持对特定说话人的语音进行微调，使生成的语音更贴近特定说话人的风格。情感控制：能够根据输入的情感文本生成具有相应情感的语音。语音编辑：…
产品
- 10.1k
9 个月前
Stability AI发布AI音频模型Stable Audio Open：支持文本生成鼓点、乐器等音效

Stability AI 今天发布了 Stable Audio Open 1.0，这是其音频领域的新一款生成 AI 模型。Stability AI 以稳定扩散文本到图像生成 AI 技术而闻名，但这只是该公司产品组合的一部分。该公司在2023年首次推出了 Stable Audio，这是一种文本到音频的生成 AI 工具。最近发布的 Stable Audio2.0提高了生成音频的清晰度和长度。与完整版…
资讯
- 3.4k
9 个月前

搜索