OpenAI 最新论文：o3 在 IOI 2024 严格规则下拿到 395.64 分达成金牌成就

2 月 12 日晚间消息，在中国 AI 公司的影响下，OpenAI 公开了 O 系列强化学习的秘密。

今天（2 月 12 日），OpenAI 发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》，文中放出了 OpenAI 三个推理模型：o1、o1-ioi、o3 在 IOI（国际信息学奥林匹克竞赛）和 CodeForces（全球知名在线编程竞赛）中的成绩。

论文显示，在 IOI 2024 中，o3 在严格规则下拿到 395.64 分，达成金牌成就，并且在 CodeForces 上的表现与人类精英选手相当。

论文中还提到，中国的 DeepSeek-R1 和 Kimi k1.5 通过独立研究显示，利用思维链学习（COT）方法，可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5 是 DeepSeek 和 Kimi 在 1 月 20 日同时发布的新型推理模型。

该论文通过强化学习（RL）训练的大型语言模型在复杂编码和推理任务上的性能提升，比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明，增加强化学习训练计算和测试时计算可显著提升模型性能，使其接近世界顶尖人类选手，这些模型将在科学、编码、数学等领域的 AI 应用中解锁新的应用体验。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

OpenAI 最新论文：o3 在 IOI 2024 严格规则下拿到 395.64 分达成金牌成就

豆包提出全新稀疏模型架构 UltraMem，推理成本较 MoE 最高可降 83%

OpenAI 承诺其 AI 模型不审查、不屏蔽观点，保障思想自由

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

豆包提出全新稀疏模型架构 UltraMem，推理成本较 MoE 最高可降 83%

OpenAI 承诺其 AI 模型不审查、不屏蔽观点，保障思想自由

论文作弊终结者：OpenAI推出反作弊工具，准确度99.9%

OpenAI副总裁称将永远提供免费ChatGPT版本

OpenAI 与博通洽谈，计划投资7万打造 AI 芯片!

“废片”也值钱：谷歌、OpenAI 被曝购买创作者未发布视频素材，以训练 AI 模型

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注