Riffusion 是一个免费开源的具有稳定扩散的实时音乐和音频生成库,用户只需输入音乐描述,AI便可以生成对应风格的音乐。该开源项目由Seth Forsgren 和 Hayk Martiros推出,Riffusion的背后原理是基于Stable Diffusion(文本生成图像模型)微调频谱图,频谱图是音频的视觉表示,显示不同频率随时间的振幅,而后再将高保真度的频谱图图像转换为音频。
Riffusion功能
- 基于文本提示生成音乐图像:用户可以通过输入文本提示,让Riffusion生成对应的音乐图像。
- 实时音乐生成:Riffusion能够快速生成音乐,满足用户对即时创作的需求。
- 独特的音乐创作方式:通过将声音视觉化,Riffusion提供了一种全新的音乐创作方法。
官网链接:https://www.riffusion.com