元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

元象 XVERSE 发布中国最大 MoE 开源模型 XVERSE-MoE-A36B。

该模型总参数 255B，激活参数 36B，官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升，同时训练时间减少 30%，推理性能提升 100%，使每 token 成本大幅下降。

MoE（Mixture of Experts）混合专家模型架构，将多个细分领域的专家模型组合成一个超级模型，在扩大模型规模的同时，保持模型性能最大化，甚至还能降低训练和推理的计算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、马斯克旗下 xAI 公司的 Grok 等大模型都使用了 MoE。

在多个评测中，元象 MoE 超过多个同类模型，包括国内千亿 MoE 模型 Skywork-MoE、传统 MoE 霸主 Mixtral-8x22B 以及 3140 亿参数的 MoE 开源模型 Grok-1-A86B 等。

元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

附相关链接：

Hugging Face：https://huggingface.co/xverse/XVERSE-MoE-A36B
魔搭：https://modelscope.cn/models/xverse/XVERSE-MoE-A36B
Github：https://github.com/xverse-ai/XVERSE-MoE-A36B

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

阿联酋国有投资公司 MGX 考虑向 OpenAI 投资数十亿美元

Meta 承认使用澳大利亚 Facebook、Instagram 成年用户发布的公开内容训练AI模型

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

​阿联酋国有投资公司 MGX 考虑向 OpenAI 投资数十亿美元

Meta 承认使用澳大利亚 Facebook、Instagram 成年用户发布的公开内容训练AI模型

李开复旗下 AI 公司零一万物宣布开源 Yi-9B 模型，号称同系列代码、数学能力最强

Meta即将推出新一代Llama3大语言模型

全球首个芯片设计开源大模型SemiKong正式发布 性能超越通用大模型

超越Llama 3的性能怪兽：Falcon 2开源大模型，商用AI的新标杆

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

阿联酋国有投资公司 MGX 考虑向 OpenAI 投资数十亿美元

全球首个芯片设计开源大模型SemiKong正式发布性能超越通用大模型