元象大模型开源30款量化版本可更低成本部署

资讯
1 年前

元象大模型开源了30款量化版本，支持 vLLM 和 llama.cpp 等主流框架的量化推理，无条件免费商用。

对量化前后的模型能力、推理性能进行评估，以 XVERSE-13B-GPTQ-Int4量化版本为例，量化后模型权重压缩了72%，总吞吐提高了1.5倍，同时保留了95% 的能力。

元象大模型开源30款量化版本可更低成本部署

开发者可以根据技能、软硬件配置和具体需求选择不同推理框架和数据精度的模型。如果本地资源有限，可以直接调用元象大模型的 API 服务（chat.xverse.cn）。

总体来说，元象大模型的开源量化版本提供了方便快捷的部署方式，可以根据需求选择不同的框架和精度模型进行部署和推理。

元象大模型下载：

Hugging Face:https://huggingface.co/xverse
ModelScope魔搭:https://modelscope.cn/organization/xverse
Github:https://github.com/xverse-ai

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

元象大模型开源

AI风险管理初创公司ValidMind筹集810万美元，助力银行遵守监管要求

2024-3-28 14:39:10

Meta 下月将为 Ray-Ban 智能眼镜带来一系列 AI 功能：物体识别、翻译等

2024-3-29 9:48:58

搜索