俄罗斯科技巨头 Yandex 宣布开源“YaFSDP”大语言模型训练工具：大幅提升 GPU 利用率，对 Llama 3 可实现 26% 加速

俄罗斯科技巨头 Yandex 推出了一款开源的大语言模型训练工具 ——YaFSDP，号称与现有工具相比速度最高可提升 26%。

据介绍，YaFSDP 在训练速度方面优于传统的 FSDP 方法，尤其适用于大型模型。在预训练 LLM 方面，YaFSDP 速度提高了 20%，并且在高内存压力条件下表现更佳。

例如，YaFSDP 对具有 700 亿参数的 Llama 2 可以实现 21% 的效率提升，对具有同级参数的 Llama 3 也实现了 26% 的效率提升。IT之家附官方数据一览：

模型	gpu-count	seq-len	num-ckpt-layers	speedup
Llama 2 7B	64	2048	0	9.92%
Llama 2 7B	64	4096	0	3.43%
Llama 2 7B	64	8192	0	2.68%
Llama 2 7B	128	2048	0	9.57%
Llama 2 7B	128	4096	0	2.42%
Llama 2 7B	128	8192	0	2.32%
Llama 2 13B	128	2048	0	12.10%
Llama 2 13B	128	4096	0	3.49%
Llama 2 34B	128	2048	0	20.70%
Llama 2 34B	256	2048	0	21.99%
Llama 2 34B	256	4096	5	8.35%
Llama 2 70B	256	2048	10	21.48%
Llama 2 70B	256	4096	50	7.17%
Llama 3 8B	64	2048	0	11.91%
Llama 3 8B	64	4096	0	7.86%
Llama 3 70B	256	2048	20	26.60%

Yandex 表示，通过优化 GPU 使用率，YaFSDP 可以为开发者和公司节省大量资金 —— 每月可能节省数十万美元。

Yandex 的资深开发人员、YaFSDP 团队成员之一 Mikhail Khruschev 还提到，“目前，我们正在积极尝试各种模型架构和参数大小，以扩展 YaFSDP 的通用性” 。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

俄罗斯科技巨头 Yandex 宣布开源“YaFSDP”大语言模型训练工具：大幅提升 GPU 利用率，对 Llama 3 可实现 26% 加速

OpenAI 官宣新任首席财务官、首席产品官，并与苹果达成合作

苹果高管：正努力将“Apple Intelligence”引入中国市场

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

OpenAI 官宣新任首席财务官、首席产品官，并与苹果达成合作

苹果高管：正努力将“Apple Intelligence”引入中国市场

阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型，与 Meta Llama3-70B 相媲美

世界最大开源 AI 社区 Hugging Face 将免费提供 1000 万美元共享 GPU，帮助小企业对抗大公司

B站开源轻量级 Index-1.9B 系列模型：2.8T 训练数据，支持角色扮演

阿里云 CTO 周靖人：通义开源模型下载量破 2000 万，坚定拥抱开源

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注