OpenAI 曾秘密测试 GPT-4o，力压群雄登顶聊天机器人竞技场排行榜

OpenAI 员工 William Fedus 周一在社交平台 X 证实，近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”，正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露，GPT-4o 在测试中登顶了竞技场排行榜，取得了有史以来的最高分。

“GPT-4o 是我们最先进的尖端模型，”Fedus 在推特上写道，“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”

OpenAI 曾秘密测试 GPT-4o，力压群雄登顶聊天机器人竞技场排行榜

聊天机器人竞技场是一个网站，访客可以同时与两个随机的 AI 语言模型对话，却不知道哪个是哪个，然后选择提供更好回复的模型。

从今年 4 月份开始，OpenAI 在竞技场测试了多个版本的 GPT-4o，该模型最初以“gpt2-chatbot” 的名称出现，然后变成了“im-a-good-gpt2-chatbot”，最后是“im-also-a-good-gpt2-chatbot”。

自 GPT-4o 今日发布以来，多方消息人士透露，该模型以巨大优势登顶了 LMSYS 的内部排行榜，超越了之前排名最高的模型 Claude 3 Opus 和 GPT-4 Turbo。

lmsys.org 的官方账号分享了一张图表，并写道：“‘gpt2-chatbot’系列模型刚刚飙升至榜首，以显著的优势（约 50 Elo）超越了所有其他模型，它已经成为竞技场中最强大的模型。这是一张内部截图，公开版本的‘gpt-4o’现已进入竞技场，并很快将出现在公开排行榜上！”

OpenAI 曾秘密测试 GPT-4o，力压群雄登顶聊天机器人竞技场排行榜

截至发稿时，“im-also-a-good-gpt2-chatbot” 的 Elo 分数为 1309，领先于 GPT-4-Turbo-2023-04-09 的 1253 分和 Claude 3 Opus 的 1246 分。在三个“gpt2-chatbot” 出现并搅局之前，Claude 3 和 GPT-4 Turbo 一直在排行榜上争夺冠军。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

OpenAI 曾秘密测试 GPT-4o，力压群雄登顶聊天机器人竞技场排行榜

对轰 GPT-4o，谷歌推出 Astra 项目：手机镜头内低延迟聊天交互

腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

对轰 GPT-4o，谷歌推出 Astra 项目：手机镜头内低延迟聊天交互

腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用

纽约时报以版权为由起诉微软和OpenAI 使用其文章训练大模型

OpenAI重磅发布全能模型GPT-4o，免费开放给所有用户使用！

OpenAI CEO：GPT-5会很特别 可能类似于一个 “虚拟大脑”

重磅！​ChatGPT大升级，OpenAI发布GPT-4o Mini

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

OpenAI CEO：GPT-5会很特别可能类似于一个 “虚拟大脑”

重磅！ChatGPT大升级，OpenAI发布GPT-4o Mini