英伟达发布 80 亿参数新 AI模型：精度、效率高，可在 RTX 工作站上部署

英伟达于 8 月 21 日发布博文，发布了 Mistral-NeMo-Minitron 8B 小语言 AI 模型，具备精度高、计算效率高等优点，可在 GPU 加速的数据中心、云和工作站上运行模型。

英伟达携手 Mistral AI 上月发布开源 Mistral NeMo 12B 模型，在此基础上英伟达再次推出更小的 Mistral-NeMo-Minitron 8B 模型，共 80 亿个参数，可以在搭载英伟达 RTX 显卡的工作站上运行。

英伟达表示通过宽度剪枝（width-pruning）Mistral NeMo 12B，并知识蒸馏（knowledge distillation）轻度重新训练后获得 Mistral-NeMo-Minitron 8B，相关成果发表在《Compact Language Models via Pruning and Knowledge Distillation》论文中。

剪枝通过去除对准确率贡献最小的模型权重来缩小神经网络。在 "蒸馏" 过程中，研究小组在一个小型数据集上重新训练剪枝后的模型，以显著提高通过剪枝过程而降低的准确率。

就其规模而言，Mistral-NeMo-Minitron 8B 在语言模型的九项流行基准测试中遥遥领先。这些基准涵盖了各种任务，包括语言理解、常识推理、数学推理、总结、编码和生成真实答案的能力。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

英伟达发布 80 亿参数新 AI模型：精度、效率高，可在 RTX 工作站上部署

原 Character.AI CEO 诺姆・沙泽尔“回家”后履新，消息称将任谷歌 Gemini 联合技术负责人

全球消费级 AI 移动应用 TOP 50 榜单：美图秀秀挤进前十，字节跳动豆包首次上榜排 26 位

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

原 Character.AI CEO 诺姆・沙泽尔“回家”后履新，消息称将任谷歌 Gemini 联合技术负责人

全球消费级 AI 移动应用 TOP 50 榜单：美图秀秀挤进前十，字节跳动豆包首次上榜排 26 位

号称全球最强开源 AI 模型，DBRX 登场：1320 亿参数，语言理解、编程能力等均超 GPT-3.5

LG 推出韩国首个开源 AI 模型 EXAONE 3.0，韩语测试排名第一

​英伟达团队推出 AI模型 StormCast，高精度天气预测，精准预测几公里内雷暴天气

Anthropic 修改服务政策：允许第三方将自家 Claude 等 AI 模型用于“未成年人产品”中

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

英伟达团队推出 AI模型 StormCast，高精度天气预测，精准预测几公里内雷暴天气