Meta 开源小语言 AI模型 MobileLLM 家族：适用智能手机、提供 125M-1B 版本

Meta 于上周发布新闻稿，宣布正式开源可在智能手机上运行的小语言模型 MobileLLM 家族，并同时为系列模型新增 600M、1B 和 1.5B 三种不同参数版本，附项目 GitHub 项目页如下（点此访问）。

Meta 研究人员表示，MobileLLM 模型家族专为智能手机打造，该模型号称采用了精简架构，并引入了“SwiGLU 激活函数”、“分组查询注意力（grouped-query attention）”机制，能够在兼顾效率与表现成果。

此外，MobileLLM 模型据称训练速度较快，Meta 研究人员声称他们在 32 颗 Nvidia A100 80G GPU 的服务器环境下，以 1 万亿词（tokens）训练不同参数量的 MobileLLM 模型时，1.5B 版本只需 18 天，而 125M 版本仅需 3 天。

而从结果来看，MobileLLM 125M 和 350M 两款模型在零样本常识理解任务中的准确率比 Cerebras、OPT、BLOOM 等 State of the Art（SOTA）模型分别高出 2.7% 和 4.3%。

Meta 研究人员同时将 MobileLLM-1.5B 与业界其他参数量更大的模型进行比较，在结果测试方面据称领先 GPT-neo-2.7B、OPT-2.7B、BLOOM-3B、Qwen 1.5-1.8B 等模型。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

Meta 开源小语言 AI模型 MobileLLM 家族：适用智能手机、提供 125M-1B 版本

60 秒生成 5 秒 AI 视频，字节自研视频生成模型 Seaweed 开放使用

告别“默片”：智谱发布新清影，可生成 10 秒 4K60 帧 / 自带音效视频

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

60 秒生成 5 秒 AI 视频，字节自研视频生成模型 Seaweed 开放使用

告别“默片”：智谱发布新清影，可生成 10 秒 4K60 帧 / 自带音效视频

Meta AI为移动设备开发紧凑型语言模型MobileLLM，仅3.5亿参数

开源多模态巨兽登场！Meta将于7月23日推出Llama 3 405B模型

震惊AI界！Llama 3.1泄露：4050亿参数的开源巨兽来袭！

端侧最强开源 AI模型 Llama 3.2 登场：可在手机运行，从 1B 纯文本到 90B 多模态，挑战 OpenAI 4o mini

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注