加拿大初创公司推出 Command A 轻量级 AI 模型,号称仅需两块英伟达 A100 / H100 GPU 即可部署

加拿大 AI 初创公司 Cohere 发布了一款名为“Command A”的 AI模型,该模型主打轻量化应用,号称只需要两块英伟达 A100 或 H100 GPU 即可轻松部署,号称“表现能和 GPT-4o 相媲美”,实现“用最少的硬件发挥最大的性能”。

加拿大初创公司推出 Command A 轻量级 AI 模型,号称仅需两块英伟达 A100 / H100 GPU 即可部署

Cohere 表示,Command A 专门为中小型企业环境设计,其支持 256k 的上下文长度和 23 种语言,作为比较,其他竞争对手的“同类模型”需要 32 块 GPU 才能部署。

在性能测试中,Command A 最快每秒可以输出 156 个 Token,据称比 GPT-4o 快 1.75 倍。而在指令追踪、SQL、代理程序和工具任务的基准测试上,Command A 也表现出色。

Cohere 援引相应性能数据,声称业界的大语言模型如果“规模过大”,反而在输出结果时可能会出现严重的延迟问题;如果只是想快速得到正确答案,Command A 相对是个不错的选择。

目前,Cohere 已将相应 Command A 发布在 Hugging Face 平台(点此访问),对学术界开放使用,未来还会登陆其他云服务平台。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

清华团队开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

2025-3-14 20:53:15

资讯

Google Assistant 停用倒计时,谷歌 AI 助手开启迁移至 Gemini

2025-3-15 11:30:16

搜索