-
Seed-TTS:字节推出的语音生成模型,可生成媲美人类的语音
Seed-TTS是一款高质量、多功能的语音生成模型,能够生成几乎与人类语音无法区分的语音。它具有出色的语音控制能力,能够生成具有情感的、多样化的语音,适用于多种场景。 Seed-TTS功能 零-shot语境学习:能够在不同语境下生成自然流畅的语音。 说话人微调:支持对特定说话人的语音进行微调,使生成的语音更贴近特定说话人的风格。 情感控制:能够根据输入的情感文本生成具有相应情感的语音。 语音编辑:…- 10.1k
-
Stability AI发布AI音频模型Stable Audio Open:支持文本生成鼓点、乐器等音效
Stability AI 今天发布了 Stable Audio Open 1.0,这是其音频领域的新一款生成 AI 模型。Stability AI 以稳定扩散文本到图像生成 AI 技术而闻名,但这只是该公司产品组合的一部分。该公司在2023年首次推出了 Stable Audio,这是一种文本到音频的生成 AI 工具。最近发布的 Stable Audio2.0提高了生成音频的清晰度和长度。 与完整版…- 3.4k