苹果发布 OpenELM，基于开源训练和推理框架的高效语言模型

在 WWDC24 之前，苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为 OpenELM。

当然，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。

苹果发布 OpenELM，基于开源训练和推理框架的高效语言模型

官方简介翻译如下：

大型语言模型的可重复性和透明性对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。为此，我们发布了 OpenELM，一个最先进的开源语言模型。

OpenELM 使用分层缩放策略，可以有效地分配 Transformer 模型每一层的参数，从而提高准确率。例如，在参数量约为 10 亿的情况下，OpenELM 与 OLMo 相比准确率提升了 2.36%，同时所需的预训练 tokens 数量仅有原来的 50%。

与以往只提供模型权重和推理代码并在私有数据集上进行预训练的做法不同，我们发布的版本包含了在公开数据集上训练和评估语言模型的完整框架，包括训练日志、多个检查点和预训练配置。

我们还发布了将模型转换为 MLX 库的代码，以便在苹果设备上进行推理和微调。此次全面发布旨在增强和巩固开放研究社区，为未来的开放研究工作铺平道路。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

苹果发布 OpenELM，基于开源训练和推理框架的高效语言模型

2024年8个AI商业趋势最先进的AI模型变得越来越昂贵

日本横须贺市尝试由“AI 市长”发布英语信息，将用于观光导览

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

2024年8个AI商业趋势 最先进的AI模型变得越来越昂贵

日本横须贺市尝试由“AI 市长”发布英语信息，将用于观光导览

苹果澄清：YouTube字幕数据未用于Apple Intelligence，OpenELM仅作研究用途

AppleIntelligence发布！苹果发布大模型Siri

苹果 Apple Intelligence 功能分批上线，重磅功能要等到明年

​OpenAI 董事会将不再有微软和苹果担任观察员

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

2024年8个AI商业趋势最先进的AI模型变得越来越昂贵

OpenAI 董事会将不再有微软和苹果担任观察员