通义千问 Qwen 2.5-Max 超大规模 MoE 模型号称优于 Deepseek V3 等竞品，暂未开源

1 月 29 日消息，新年之际，阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE模型，大家可以通过 API 的方式进行访问，也可以登录 Qwen Chat 进行体验，例如直接与模型对话，或者使用 artifacts、搜索等功能。

据介绍，通义千问 Qwen 2.5-Max 使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。

性能

阿里云直接对比了指令模型的性能表现（注：指令模型即我们平常使用的可以直接对话的模型）。对比对象包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet，结果如下：

通义千问 Qwen 2.5-Max 超大规模 MoE 模型号称优于 Deepseek V3 等竞品，暂未开源

在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现超越了 DeepSeek V3，同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中，由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型，阿里云将 Qwen2.5-Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B，以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。对比结果如下图所示：

通义千问 Qwen 2.5-Max 超大规模 MoE 模型号称优于 Deepseek V3 等竞品，暂未开源

我们的基座模型在大多数基准测试中都展现出了显著的优势。我们相信，随着后训练技术的不断进步，下一个版本的 Qwen2.5-Max 将会达到更高的水平。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

通义千问 Qwen 2.5-Max 超大规模 MoE 模型号称优于 Deepseek V3 等竞品，暂未开源

OpenAI 推出 ChatGPT Gov：专为美国政府机构打造的高安全 AI 平台

意大利机构要求 DeepSeek 提供数据保护相关信息

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

OpenAI 推出 ChatGPT Gov：专为美国政府机构打造的高安全 AI 平台

意大利机构要求 DeepSeek 提供数据保护相关信息

阿里云：通义千问API日调用量破亿 企业用户破9万

阿里云通义千问 2.5 大模型发布，号称“多项能力赶超 GPT-4”

阿里云通义千问开源两款语音基座模型，识别效果优于 OpenAI Whisper

传音控股与阿里云达成合作，旗下 AI 手机已搭载通义千问大模型

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

阿里云：通义千问API日调用量破亿企业用户破9万