开源大模型DBRX：1320亿参数，比Llama2-70B快1倍

大数据公司Databricks最近发布了一款名为DBRX的MoE大模型，引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型，成为了新的开源之王。这款模型的总参数量达到了1320亿，但每次激活只有360亿参数，并且其生成速度比Llama2-70B快1倍。

DBRX是由16个专家模型组成，每次推理有4个专家处于激活状态，上下文长度为32K。为了训练DBRX，Databricks团队从云厂商那里租用了3072个H100，历时两个月进行训练。经过内部讨论，团队决定采用课程学习的方法，用高质量数据提高DBRX在特定任务上的能力。这一决策取得了成功，DBRX在语言理解、编程、数学和逻辑等方面均达到了SOTA水平，并在大多数基准测试中击败了GPT-3.5。

Databricks还发布了DBRX的两个版本:DBRX Base和DBRX Instruct，前者是预训练基础模型，后者则经过指令微调。首席科学家Jonathan Frankle透露团队接下来计划对模型进行进一步研究，探索DBRX如何在训练的“最后一周”中获得额外技能。

尽管DBRX受到开源社区的欢迎，但也有人对其“开源”的质疑。根据Databricks公布的协议，基于DBRX打造的产品，如果月活超过7亿，就必须另行向Databricks提交申请。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

开源大模型DBRX：1320亿参数，比Llama2-70B快1倍

B站CEO陈睿：AI内容消费人群中6成是00后

Heygen发布Avatar in Motion 1.0新功能不只对口型，还能复制你的动作、姿态

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

B站CEO陈睿：AI内容消费人群中6成是00后

Heygen发布Avatar in Motion 1.0新功能 不只对口型，还能复制你的动作、姿态

李开复旗下 AI 公司零一万物宣布开源 Yi-9B 模型，号称同系列代码、数学能力最强

阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型，与 Meta Llama3-70B 相媲美

B站开源轻量级 Index-1.9B 系列模型：2.8T 训练数据，支持角色扮演

智谱 AI宣布GLM-4-9B、CodeGeeX4-ALL-9B 支持 Ollama 部署

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

Heygen发布Avatar in Motion 1.0新功能不只对口型，还能复制你的动作、姿态