Mistral 发布 Pixtral Large 多模态 AI模型:登顶复杂数学推理,图表 / 文档推理超过 GPT-4o

11 月 19 日消息,Mistral AI 公司昨日(11 月 18 日)发布公告,宣布了全新的Multimodality AI Models Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。

Mistral 发布 Pixtral Large 多模态 AI模型:登顶复杂数学推理,图表 / 文档推理超过 GPT-4o

Pixtral Large 现已在 Mistral 研究许可证和商业许可证下提供,适用于研究、教育以及商业用途。

Pixtral Large 是 Mistral AI 多模态家族中的第二个模型。IT之家援引官方新闻稿,该模型在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试中表现出色,尤其在 MathVista 中达到了 69.4% 的准确率,超越了所有竞争对手。

在 ChartQA 和 DocVQA 测试中,Pixtral Large 同样表现优异,超越了 GPT-4o 和 Gemini-1.5 Pro。

该模型配备了 123B 的多模态解码器和 1B 的视觉编码器,支持 128K 的上下文窗口,能够处理至少 30 张高分辨率图像。Pixtral Large 不仅在视觉数据上表现出色,同时在复杂推理和图表理解方面也具备强大能力。

statement:The content is collected from various media platforms such as public websites. If the included content infringes on your rights, please contact us by email and we will deal with it as soon as possible.
Information

云深处“山猫”全地形越野机器人发布:可爬 22 厘米台阶、45° 斜坡,9.8 万元

2024-11-19 21:44:22

Information

OpenAI 早有“造芯梦”:曾考虑收购晶圆级芯片企业 Cerebras

2024-11-20 0:36:24

Search