昆仑万维：中国首个音乐 SOTA 模型天工 SkyMusic 音乐大模型开启公测

昆仑万维今日宣布，天工 3.0 大模型性能提升显著，旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。

天工 3.0 拥有 4000 亿参数，超越了 3140 亿参数的 Grok-1，是全球最大的开源 MoE 大模型。天工 3.0 在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域性能提升显著，数学 / 推理 / 代码 / 文创能力提升超过 30%。天工 3.0 新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项 AI 能力。

▲ 天工 3.0 模型参数超越 Grok-1

天工 3.0 旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。昆仑万维表示天工 SkyMusic 在人声 & BGM 音质、人声自然度、发音可懂度等领域“显著”领先对手，综合性能超越 Suno V3，取得音乐大模型 SOTA（State of the art model，即在当前研究中表现最好的模型）。

昆仑万维：中国首个音乐 SOTA 模型天工 SkyMusic 音乐大模型开启公测

天工 SkyMusic 采用音乐音频领域类 Sora 模型架构，Large-scale Transformer 负责谱曲，来学习 Music Patches 的上下文依赖关系，同时完成音乐可控性，Diffusion Transformer 负责演唱，通过 LDM 让 Music Patches 被还原成高质量音频，使其能够支持生成 80 秒 44100Hz 采样率双声道立体声歌曲。

昆仑万维：中国首个音乐 SOTA 模型天工 SkyMusic 音乐大模型开启公测

▲ 天工 SkyMusic AI 音乐大模型技术架构

据介绍，天工 SkyMusic 具备以下特点：

高质量 AI 音乐：生成 80 秒 44100Hz 采样率双声道立体声 AI 歌曲

人声“以假乱真”：中文水平极为优秀，发音清晰无异响

歌词段落控制：生成的歌曲可以明确分辨出不同歌词段落的情绪变化

多种音乐风格：支持说唱 / 民谣 / 放克 / 古风 / 电子等

音乐智能表达：能够学习如颤音、歌剧、吟唱、男女对唱，自动和声等多种歌唱技巧

参考音乐生成：用户上传自有参考音乐，生成风格、唱腔类似的歌曲

方言歌曲生成：支持粤语、成都话、北京话等众多方言

从公开资料获悉，昆仑万维是中国互联网平台出海企业，深耕海外市场十余载，业务覆盖包括信息分发、社交、娱乐、元宇宙、游戏及 AIGC 等多个领域，旗下包括 AGI 与 AIGC 、海外信息分发与元宇宙、投资等三大业务板块，市场遍及中国、东南亚、非洲、中东、北美、南美、欧洲等地。截至目前，全球平均月活跃用户近 4 亿，海外收入占比达 84%。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

昆仑万维：中国首个音乐 SOTA 模型天工 SkyMusic 音乐大模型开启公测

Chrome 浏览器桌面版地址栏即将整合聊天机器人 Gemini

蚂蚁集团、OpenAI、科大讯飞等联合编制大模型安全国际标准发布

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

Chrome 浏览器桌面版地址栏即将整合聊天机器人 Gemini

蚂蚁集团、OpenAI、科大讯飞等联合编制 大模型安全国际标准发布

昆仑万维：天工 SkyMusic AI音乐生成大模型4月17日正式上线免费开放

昆仑万维：23年收入49亿净利润13亿 将加大AI研发投入

昆仑万维宣布 4 月 17 日发布并开源“天工大模型 3.0”：4000 亿参数，号称性能超 Grok 1.0

号称“音乐ChatGPT 时刻”来临，天工 SkyMusic 音乐生成大模型今日邀测

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

蚂蚁集团、OpenAI、科大讯飞等联合编制大模型安全国际标准发布

昆仑万维：23年收入49亿净利润13亿将加大AI研发投入