OpenAI 宣布推出最新的轻量级生成模型 GPT-4o mini。与旗舰版 GPT-4o 模型相比,GPT-4o mini 资源消耗更少,成本更低,方便开发人员将人工智能技术应用到更广泛产品中。
这对开发人员和应用程序来说是一次重大升级,同时也扩展了 ChatGPT 免费版的功能并减少了限制。
从本周四起,ChatGPT免费版、Plus 版和团队版用户可以通过 ChatGPT 网页和应用程序使用 GPT-4o mini,而企业用户将从下周开始可以访问GPT-4o mini。
同时,GPT-4o mini 将取代现有的 GPT-3.5 Turbo 模型,面向所有终端用户。
如果开发者还不想改用 4o mini,仍然可以通过应用程序接口使用旧模型。OpenAI 表示,他们最终会淘汰旧的模型,但目前尚未确定具体日期。
自5月以来,GPT-4o 模型已可用于免费 ChatGPT 帐户,但在三小时内只能使用有限次数的 GPT-4o。此次更新后,GPT-4o 仍然有使用次数限制,但当你达到上限时,模型会自动切换到 GPT-4o mini,而不是 GPT-3.5。
根据Artificial Analysis的数据,OpenAI最新的人工智能模型在MMLU推理基准测试中获得了82%的分数,比Gemini 1.5 Flash高出3%,比Claude 3 Haiku高出7%。
此外,OpenAI 声称 GPT-4o mini 的运行成本比 GPT-3.5 Turbo 低 60%。GPT-4o mini 的价格为每百万输入token 15 美分,每百万输出token 60 美分。OpenAI 称 GPT-4o mini 是 "当今功能最强大、最具成本效益的小型模型"。
这些成本节约是如何实现的呢?实际上,并不是每项人工智能任务都需要像 GPT、Claude 或 Gemini 这样功能强大的大型模型。就像用牛刀杀鸡一样,用大型语言模型(LLM)来完成简单但数量很多的任务是小题大做,既浪费钱又浪费计算资源。
这正是 Google 的 Gemini 1.5 Flash、Meta 的 Llama 3 8b 或 Anthropic 的 Claude 3 Haiku 等小型语言模型发挥作用的地方。它们能够更快、更经济高效地执行这些简单的重复性任务。
据 OpenAI 称,GPT-4o mini 的上下文窗口与旗舰版GPT-4o 模型一样,有 128000 个token(相当于一本书的内容),知识截止日期为 2023 年 10 月。模型 API 目前只提供文本和视觉功能,但未来还将支持视频和音频功能。