DeepSeek 已经将生成模型的竞赛提升到了另一个层次。
现在甚至有人准备在本地运行拥有 671B 参数的模型。
但在本地运行如此庞大的模型并非儿戏;仅仅是进行推理操作,你就需要在硬件方面做出重大升级。
下面大致分解了在你的 PC 上运行 DeepSeek-R1 所需的成本。
硬件成本
大部分费用都花在硬件上。我们将讨论 GPU、CPU、内存(RAM)、SSD 存储、散热系统等。
你需要的配置如下(按照今天汇率 1美元=7.29人民币):
GPU
- 4块 NVIDIA H100 80GB GPU(每块 $25,000)
- 总成本:100,000美元(约为729,000元)
- 原因:这些 GPU 是最先进的加速器,专为 AI 工作负载优化,使得像 DeepSeek-R1 这样的大型模型能够实现更快的训练和推理。
- NVIDIA H100:NVIDIA H100 是一款基于 Hopper 架构的先进 GPU。它配备了第四代张量核心和 Transformer 引擎,相比之前的 A100 GPU,可实现高达 9 倍的 AI 训练速度和 30 倍的推理速度。
CPU
- Intel Xeon Platinum
- 总成本: 1,550美元(约为11,299.50元)
- 原因:高端 CPU 能确保在资源密集型操作期间实现流畅的多任务处理和系统稳定性。
- Intel Xeon Platinum 之所以在 DeepSeek-R1 推理中必不可少,是因为它具备先进的 AI 加速功能,如 Intel AMX 和 AVX-512,这些功能显著提升了深度学习任务的性能。
- 它相比上一代产品提供高达 42% 的 AI 推理性能提升,非常适合处理高负载工作。此外,其优化的内存和互连技术确保了对大型数据集和复杂模型的高效处理。
内存 (RAM)
- 512GB DDR4 (6,399.98 美元)
- 总成本:6,399.98 美元 (约为46,655.85元)
- 原因: 大容量内存对于处理海量数据集和模型参数而不出现性能瓶颈至关重要。
存储 (Storage)
- 4TB NVMe SSD (249.99 美元)
- 总成本:249.99 美元 (约为1,822.43元)
- 原因: 快速的存储能够确保训练期间数据的迅速读取。
- SSD(固态硬盘)是一种利用闪存存储数据的设备,与传统机械硬盘 (HDD) 相比,其读写速度更快、耐用性更高且能效更好。
- 4TB NVMe SSD 特指采用 NVMe(Non-Volatile Memory Express)协议的高容量(4 TB)固态硬盘,该协议利用 PCIe 接口,实现比旧式基于 SATA 接口的 SSD 更快的数据传输速率。
- NVMe SSD 特别适用于对速度和大容量存储要求极高的任务,如游戏、视频编辑或服务器应用。
电源供应器 (Power Supply Unit, PSU)
- 2000W PSU (259.99 美元)
- 总成本:259.99 美元 (约为1,895.33元)
- 原因: 高瓦数电源能够可靠地为多块 GPU 提供稳定供电。
散热系统 (Cooling System)
- 定制液冷循环 (500 美元)
- 总成本:500 美元 (约为3,645.00元)
- 原因: GPU 在运行时会产生大量热量,液冷系统有助于防止过热。
主板 (Motherboard)
- ASUS S14NA-U12 (500 美元)
- 总成本:500 美元 (约为3,645.00元)
- 原因: 支持双插槽 GPU 和高端 CPU 的搭载。
机箱 (Chassis)
- Cooler Master Cosmos C700M (482 美元)
- 总成本:482 美元 (约为3,513.78元)
- 原因: 宽敞的机箱可以容纳定制散热系统和多块 GPU。
- 硬件总成本:约 109,941 美元 (约801,469.89元)
软件成本 (Software Costs)
运行 DeepSeek-R1 所需的软件均为免费,但你需要准备以下组件:
- 操作系统: Debian Linux(免费)
- 编程语言: Python 3.10+(免费)
- DeepSeek-R 模型: 70B 参数模型(免费)
- CUDA Toolkit & cuDNN: NVIDIA 的深度学习库(免费)
- 深度学习框架: 支持 CUDA 的 PyTorch(免费)
- 软件总计: 0 美元
关键要点 (Key Takeaways)
- 硬件费用占主导: GPU、内存和散热系统大约占总成本的 99%。
- 需要专业技术: 搭建这样一套系统要求具备高性能计算的相关知识。
- 替代方案: 对于短期项目,云服务(如 AWS、Google Cloud)可能更经济,但会产生持续的费用。
值不值得?
对于资金雄厚且有特定需求(例如隐私保护、离线使用)的研究人员、企业或发烧友来说,本地搭建系统能提供无与伦比的控制力和速度;而对于其他用户来说,使用云平台或选择较小的模型可能更为实用。
不过,由于整体价格接近 11 万美元(约801,900.00元),对于个人,这样的投入确实难以承受。
不过,你可以尝试那些经过蒸馏、价格更亲民的模型版本。
那么,你打算在本地运行 DeepSeek-R1 吗?请再三考虑!
声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。