90/270 亿参数，谷歌发布 Gemma 2 开源 AI 模型：性能力压同级、单 A100 / H100 GPU 可运行

谷歌公司昨日发布新闻稿，面向全球研究人员和开发人员发布 Gemma 2 大语言模型，共有 90 亿参数（9B）和 270 亿参数（27B）两种大小。

Gemma 2 大语言模型相比较第一代，推理性能更高、效率更高，并在安全性方面取得了重大进步。

谷歌在新闻稿中表示，Gemma 2-27B 模型的性能媲美两倍规模的主流模型，而且只需要一片英伟达 H100 ensor Core GPU 或 TPU 主机就能实现这种性能，从而大大降低了部署成本。

Gemma 2-9B 模型优于 Llama 3 8B 和其他类似规模的开源模型。谷歌还计划在未来几个月发布参数为 26 亿的 Gemma 2 模型，更适合智能手机的人工智能应用场景。

谷歌表示为 Gemma 2 重新设计了整体架构，实现卓越的性能和推理效率。

Gemma 2 主要特点如下：

性能优异：

27B 版本在同规模级别中性能最佳，甚至比两倍于其尺寸的机型更具竞争力。9B 版本的性能在同类产品中也处于领先地位，超过了 Llama 3 8B 和其他同规模的开放模型。

效率和成本：

27B Gemma 2 模型可在单个谷歌云 TPU 主机、英伟达 A100 80GB Tensor Core GPU 或英伟达 H100 Tensor Core GPU 上以全精度高效运行推理，在保持高性能的同时大幅降低成本。这使得人工智能部署更容易实现，预算也更合理。

跨硬件快速推理

Gemma 2 经过优化，可在各种硬件（从功能强大的游戏笔记本电脑和高端台式机到基于云的设置）上以惊人的速度运行。

在 Google AI Studio 中尝试全精度的 Gemma 2，在 CPU 上使用 Gemma.cpp 的量化版本解锁本地性能，或通过 Hugging Face Transformers 在配备 NVIDIA RTX 或 GeForce RTX 的家用电脑上进行尝试。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

90/270 亿参数，谷歌发布 Gemma 2 开源 AI 模型：性能力压同级、单 A100 / H100 GPU 可运行

性能优异：

效率和成本：

跨硬件快速推理

视频生成又一落地场景！Signapse用AI手语重塑聋人沟通世界

OpenAI 与《时代》达成合作协议：可用其杂志内容训练 ChatGPT

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

性能优异：

效率和成本：

跨硬件快速推理

相关内容：

视频生成又一落地场景！Signapse用AI手语重塑聋人沟通世界

OpenAI 与《时代》达成合作协议：可用其杂志内容训练 ChatGPT

辅助提高编程效率，泄露文件显示谷歌已开发内部专供 AI模型“鹅”

新闻行业高管对谷歌 AI 「搜索生成体验」的影响表示担忧：近 40% 的流量来自谷歌

中国科大等发布SciGuard大模型 建立首个科学风险基准

谷歌：在新加坡的技术基础设施投资已达 50 亿美元

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

中国科大等发布SciGuard大模型建立首个科学风险基准