Mistral AI 推出 Mistral OCR API:宣称最快最准光学字符识别,千页 1 美元

3 月 7 日消息,Mistral AI 当地时间 6 日宣布推出 Mistral OCR API,并宣称该 API 在 OCR 光学字符识别领域具有最佳表现。

Mistral AI 推出 Mistral OCR API:宣称最快最准光学字符识别,千页 1 美元

Mistral AI 表示这一 API 具备优秀的多模态文档处理能力,能从 PDF、幻灯片、数学表达式、LaTeX 学术文档等复杂文档元素中提取文本内容,所得结果将以 Markdown 文件的形式清晰呈现。

Mistral OCR 模型可解析、理解和转录数千种脚本、字体和语言。根据 Mistral AI 给出的数据,该模型现有版本在识别中的表现优于谷歌 Document AI、微软 Azure OCR、OpenAI GPT-4o 等一系列竞争者。

Mistral AI 已将 Mistral OCR 作为其 Le Chat 聊天机器人的默认文档理解模型,该 API 的定价为每千页 1 美元(注:当前约 7.2 元人民币),单节点每分钟可处理 2000 页,这一模型已被用于历史文化遗产保护等场景。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

已预览一年,OpenAI 语音克隆服务 Voice Engine 仍未正式推出

2025-3-7 17:30:00

资讯

英国 BBC 新闻将成立 AI 部门,重点关注 25 岁以下群体、提供更个性化内容

2025-3-7 21:22:20

搜索