Canada AI Startups Cohere 发布了一款名为“Command A"of AI Models,该模型主打轻量化应用,号称只需要两块英伟达 A100 或 H100 GPU 即可轻松部署,号称“表现能和 GPT-4o 相媲美”,实现“用最少的硬件发挥最大的性能”。
Cohere 表示,Command A 专门为中小型企业环境设计,其支持 256k 的上下文长度和 23 种语言,作为比较,其他竞争对手的“同类模型”需要 32 块 GPU 才能部署。
在性能测试中,Command A 最快每秒可以输出 156 个 Token,据称比 GPT-4o 快 1.75 倍。而在指令追踪、SQL、代理程序和工具任务的基准测试上,Command A 也表现出色。
Cohere 援引相应性能数据,声称业界的大语言模型如果“规模过大”,反而在输出结果时可能会出现严重的延迟问题;如果只是想快速得到正确答案,Command A 相对是个不错的选择。
目前,Cohere 已将相应 Command A 发布在 Hugging Face 平台(Click here to visit),对学术界开放使用,未来还会登陆其他云服务平台。
statement:The content of the source of public various media platforms, if the inclusion of the content violates your rights and interests, please contact the mailbox, this site will be the first time to deal with.