AI21发布世界首个Mamba的生产级模型Jamba 支持256K上下文长度

AI21发布了世界首个Mamba的生产级模型:Jamba。这个模型采用了开创性的SSM-Transformer架构，具有52B参数，其中12B在生成时处于活动状态。Jamba结合了Joint Attention和Mamba技术，支持256K上下文长度。单个A10080GB最多可容纳140K上下文。与Mixtral8x7B相比，长上下文的吞吐量提高了3倍。

模型地址：https://huggingface.co/ai21labs/Jamba-v0.1

Jamba代表了在模型设计上的一大创新。它结合了Mamba结构化状态空间（SSM）技术和传统的Transformer架构的元素，弥补了纯SSM模型固有的局限。Mamba是一种结构化状态空间模型(Structured State Space Model， SSM)，这是一种用于捕捉和处理数据随时间变化的模型，特别适合处理序列数据，如文本或时间序列数据。SSM模型的一个关键优势是其能够高效地处理长序列数据，但它在处理复杂模式和依赖时可能不如其他模型强大。

而Transformer架构是近年来人工智能领域最为成功的模型之一，特别是在自然语言处理（NLP）任务中。它能够非常有效地处理和理解语言数据，捕捉长距离的依赖关系，但处理长序列数据时会遇到计算效率和内存消耗的问题。

Jamba模型将Mamba的SSM技术和Transformer架构的元素结合起来，旨在发挥两者的优势，同时克服它们各自的局限。通过这种结合，Jamba不仅能够高效处理长序列数据（这是Mamba的强项），还能保持对复杂语言模式和依赖关系的高度理解(这是Transformer的优势)。这意味着Jamba模型在处理需要理解大量文本和复杂依赖关系的任务时，既能保持高效率，又不会牺牲性能或精度。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

AI21发布世界首个Mamba的生产级模型Jamba 支持256K上下文长度

开源AI平台Lightning AI发布AI编译器“Thunder”以加速模型训练

马斯克旗下xAI将推出Grok-1.5

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

开源AI平台Lightning AI发布AI编译器“Thunder”以加速模型训练

马斯克旗下xAI将推出Grok-1.5

2026年逾80%企业将采用生成式AI 相比当下增长16倍-Gartner

Hugging Face 首席执行官希望实现人工智能民主：将 AI 的力量集中在少数人手中是有风险的

澜舟科技：将展示孟子大模型及全方位技术与产品体系

蚂蚁集团 CodeFuse 推出“图生代码”功能，支持产品设计图一键生成代码

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注