NVIDIA联手Hugging Face推高效推理服务，AI 模型的Token 处理效率提升五倍

最近，开源平台 Hugging Face 与 NVIDIA 宣布了一项令人振奋的新服务 —— 推理即服务（Inference-as-a-Service），这项服务将由 NVIDIA 的 NIM 技术驱动。新服务的推出可以让开发者们更快速地原型设计，使用 Hugging Face Hub 上提供的开源 AI 模型，并高效地进行部署。

这一消息是在正在举行的 SIGGRAPH2024大会上公布的。这个会议聚集了大量计算机图形学和互动技术的专家，NVIDIA 与 Hugging Face 的合作正好在此时揭晓，为开发者们带来了新的机遇。通过这项服务，开发者能够轻松部署强大的大语言模型（LLMs），例如 Llama2和 Mistral AI 模型，而 NVIDIA 的 NIM 微服务则为这些模型提供了优化。

具体来说，当以 NIM 的形式访问时，像70亿参数的 Llama3模型，其处理速度比在标准的 NVIDIA H100Tensor Core GPU 系统上部署时高出五倍，这无疑是一个巨大的提升。此外，这项新服务还支持 “在 DGX Cloud 上训练”（Train on DGX Cloud），这项服务目前已在 Hugging Face 上提供。

NVIDIA 的 NIM 是一套针对推理优化的 AI 微服务，涵盖了 NVIDIA 的 AI 基础模型和开源社区模型。它通过标准 API 显著提高了 Token 处理效率，并增强了 NVIDIA DGX Cloud 的基础设施，加速了 AI 应用的响应速度和稳定性。

NVIDIA DGX Cloud 平台专门为生成式 AI 量身定制，提供可靠且加速的计算基础设施，帮助开发者从原型到生产的整个过程，而无需长期承诺。Hugging Face 与 NVIDIA 之间的合作将进一步巩固开发者社区，而 Hugging Face 最近还宣布其团队已实现盈利，团队规模达到220人，并推出了 SmolLM 系列小型语言模型。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

NVIDIA联手Hugging Face推高效推理服务，AI 模型的Token 处理效率提升五倍

苹果 iOS 18.1 开发者测试版上线，新增AI通话录音与转录功能

24 小时抓取百万次，Anthropic AI 公司被指过度抓取网站数据

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

苹果 iOS 18.1 开发者测试版上线，新增AI通话录音与转录功能

24 小时抓取百万次，Anthropic AI 公司被指过度抓取网站数据

Lenovo与NVIDIA发布混合式人工智能解决方案， 协助企业快速采用生成式人工智能

英伟达推新AI语音识别模型Parakeet 号称优于Whisper

马斯克xAI计划建造一座“超级计算工厂” 挑战Meta大规模GPU集群

iPhone 15 也可运行，Hugging Face 推出“SmolLM”小语言 Python 编程模型

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

Lenovo与NVIDIA发布混合式人工智能解决方案，协助企业快速采用生成式人工智能