元象发布 XVERSE-MoE-A4.2B 大模型 可免费商用

元象发布了 XVERSE-MoE-A4.2B 大模型,采用混合专家模型架构,激活参数为4.2B,效果媲美13B 模型。该模型全开源免费商用,可用于海量中小企业、研究者和开发者,推动低成本部署。

该模型具有极致压缩和超凡性能两大优势,采用稀疏激活技术,效果超越多个业界顶流模型,并接近超大模型。元象 MoE 技术自研创新,研发高效融合算子、细粒度专家设计、负载均衡损失项等,最终采用实验4对应的架构设置。

元象发布 XVERSE-MoE-A4.2B 大模型 可免费商用

在商业应用上,元象大模型已与多个腾讯产品进行深度合作,为文化、娱乐、旅游、金融领域提供创新用户体验。

  • Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A4.2B
  • ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A4.2B
  • Github:https://github.com/xverse-ai/XVERSE-MoE-A4.2B
声明:内容均采集自公开的网站等各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

Harvey公司与OpenAI合作 为法律专业人士打造定制训练的案例法模型

2024-4-4 9:36:30

资讯

英特尔的芯片制造业务去年亏损数十亿美元

2024-4-4 9:39:06

搜索