Mistral 发布 Pixtral Large 多模态 AI模型：登顶复杂数学推理，图表 / 文档推理超过 GPT-4o

11 月 19 日消息，Mistral AI 公司昨日（11 月 18 日）发布公告，宣布了全新的多模态 AI模型 Pixtral Large。该模型拥有 1240 亿参数，基于 Mistral Large 2，主要用于处理文本和图片。

Pixtral Large 现已在 Mistral 研究许可证和商业许可证下提供，适用于研究、教育以及商业用途。

Pixtral Large 是 Mistral AI 多模态家族中的第二个模型。IT之家援引官方新闻稿，该模型在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试中表现出色，尤其在 MathVista 中达到了 69.4% 的准确率，超越了所有竞争对手。

在 ChartQA 和 DocVQA 测试中，Pixtral Large 同样表现优异，超越了 GPT-4o 和 Gemini-1.5 Pro。

该模型配备了 123B 的多模态解码器和 1B 的视觉编码器，支持 128K 的上下文窗口，能够处理至少 30 张高分辨率图像。Pixtral Large 不仅在视觉数据上表现出色，同时在复杂推理和图表理解方面也具备强大能力。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

Mistral 发布 Pixtral Large 多模态 AI模型：登顶复杂数学推理，图表 / 文档推理超过 GPT-4o

云深处“山猫”全地形越野机器人发布：可爬 22 厘米台阶、45° 斜坡，9.8 万元

OpenAI 早有“造芯梦”：曾考虑收购晶圆级芯片企业 Cerebras

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

云深处“山猫”全地形越野机器人发布：可爬 22 厘米台阶、45° 斜坡，9.8 万元

OpenAI 早有“造芯梦”：曾考虑收购晶圆级芯片企业 Cerebras

谷歌推出多模态 VLOGGER AI：让静态肖像图动起来“说话”

1230 亿参数，Mistral 发布 Large 2 旗舰 AI 模型：支持 80 多种编程语言，增强代码生成、数学和推理能力

Anthropic 修改服务政策：允许第三方将自家 Claude 等 AI 模型用于“未成年人产品”中

我国团队打造糖尿病专用 AI模型，助力个性化糖尿病护理

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注