英伟达11 月 25 日发布博文,宣布推出音乐生成 AI模型 Fugatto,声称是“全球最灵活的声音机器”,可以精细化控制声音生成。
英伟达表示该工具就像是声音领域的“瑞士军刀”,不仅能创作音乐、修改声音,还能灵活地混合各种音乐、人声和音效,甚至创造出前所未有的声音。
用户只需输入文字描述或者插入一些音频,Fugatto 就能生成相应的音乐片段、音效,甚至根据描述改变人声的口音和情感。
例如用户可以输入“会喵喵叫的小号”、“创作一首包含萨克斯管嚎叫、狗吠声和电子音乐的曲子”,根据用户天马行空的提示词创作音乐。
Fugatto 还可以生成独特的声音效果,例如“深沉的低音脉冲与高音数字鸣叫声交织,如同巨型智能机器苏醒的声音”。
Fugatto 还可以更改用户输入的音频片段,调整声音的口音和语气,例如将柔声细语变成愤怒的咆哮等等。
对于音乐艺术家来说,Fugatto 还可以分离歌曲中的主唱,添加乐器,甚至可以将钢琴声替换成歌剧演唱,随意改编音乐旋律,