AI 初创公司 OpenAI 于周四推出了新的 AI模型,名为 “GPT-4o mini”,这是该公司最新的一项努力,旨在扩大其受欢迎聊天机器人的使用。
这一迷你 AI 模型是 GPT-4o 的一个衍生版本,GPT-4o 是 OpenAI 推出的速度最快、最强大的模型,具有处理50种不同语言的音频、视频和文本能力。
该模型的 “o” 代表全能,OpenAI 计划在后续将图像、视频和音频整合到其中。GPT-4o Mini目前只处理图像和文本,据 OpenAI 称,它最终将支持音频、视频和其他内容类型。
现在用户可以在OpenAI的编程工具包中使用GPT-4o Mini。更重要的是,它取代了免费和付费ChatGPT客户端的GPT-3.5 Turbo,这也意味着免费为ChatGPT用户提供服务。
根据OpenAI公开测试数据显示,GPT-4o mini的数学、编码、视觉等推理能力非常好,是目前最强的多模态小模型之一。
比如,GPT-4o mini在MMLU上得分为82.0%,在数学和编码方面在MGSM测试中GPT-4o mini得分为87.0%,多模态MMMU上GPT-4o mini得分为59.4%,都超过了Gemini Flash和Anthropic的Claude Haiku。
对于开发人员来说,新的大型语言模型的成本比 GPT-3.5 Turbo 低约 60%,GPT-4o mini一百万个输入token的成本为 15 美分, GPT-3.5 Turbo每百万个输出入token的成本为 60 美分。
OpenAI 在其持有价值超过800亿美元的投资者支持下发展壮大,同时不断致力于保持生成式 AI 市场的领先地位,寻找赚钱的途径。
去年,OpenAI 首席运营官 Brad Lightcap 曾表示:“世界是多模态的。如果你考虑我们作为人类如何处理世界和与世界互动,我们看东西,我们听东西,我们说东西 — 世界远不止文本。因此对我们来说,让文本和代码成为单一的模态、我们能够拥有对这些模型有多么强大以及它们能做什么的单一接口,总是感觉不完整。”
OpenAI 周四宣布的 GPT-4o mini 将面向 ChatGPT 的免费用户、ChatGPT Plus 和 Team 订阅用户开放,ChatGPT Enterprise 用户将在下周可用。