科技媒体 NeoWin (10 月 21 日)发布博文,报道称 IBM 在其年度 TechXchange 活动上,发布了全新的 Granite 3.0 系列 AI模型,在学术和行业基准测试中可以持平或超越同等规模的模型。
Granite 3.0 系列包含多种新模型,相关模型如下:
通用 / 语言模型:
- Granite 3.0 8B Instruct
- Granite 3.0 2B Instruct
- Granite 3.0 8B Base
- Granite 3.0 2B Base
安全与防护:
- Granite Guardian 3.0 8B
- Granite Guardian 3.0 2B
专家混合模型:
- Granite 3.0 3B-A800M Instruct
- Granite 3.0 1B-A400M Instruct
- Granite 3.0 3B-A800M Base
- Granite 3.0 1B-A400M Base
IBM 表示,Granite 3.0 的 8B 和 2B 模型是企业 AI 的最佳选择,具备更强的稳健性和可靠性,能够处理更广泛的任务。这些模型在检索增强生成(RAG)、分类、总结、实体提取和工具使用等任务中表现优异。
新模型现已在 HuggingFace 平台上以 Apache 2.0 许可证提供下载;Granite Guardian 3.0 的 8B 和 2B 模型也可通过 IBM 的 watsonx 平台进行商业使用。
此外,部分 Granite 3.0 模型将进入 Nvidia NIM 微服务和 Google Cloud 的 Vertex AI Model Garden。
对于开发者而言,Granite 的代码能力可以通过 Visual Studio Code 扩展 IBM Granite.Code 来利用。该扩展支持多种编程语言,包括 C、C++、Go、Java 和 Python,帮助程序员更高效地完成任务。
Granite 3.0 系列为 IBM 的智能体 AI(agentic AI)努力奠定了基础。Granite 3.0 8B 模型具备高级推理能力和高度结构化的聊天模板,适用于实现工具使用工作流。IBM 表示,明年将推出更多关于智能体 AI 的内容,包括针对特定领域和用例的预构建代理。
总之,IBM 的 Granite 3.0 系列不仅提升了 AI 模型的性能和可用性,还为未来的智能体 AI 发展铺平了道路。