“金牌拿到了,却被批‘不守规矩’?” 就在这个周末,一场属于AI界的“奥数大战”悄然上演——OpenAI 宣布,他们的一个尚未公开的实验性大语言模型,在2025 年国际数学奥林匹克竞赛(IMO)中表现惊人,斩获金牌,总分 35/42,成绩堪比全球顶尖高中生数学大神!
而另一边,谷歌 DeepMind 也同样悄悄交出了一份金牌答卷。但不同的是,OpenAI 高调宣布、风头无两,DeepMind 却异常低调。这背后,AI巨头们到底在角力什么?一场围绕“谁先说出口”的AI竞赛争议,也随之发酵。
OpenAI:我拿金牌了,必须说!
OpenAI 研究员 Noam Brown 亲自发声:“我们的大模型,在 IMO 拿到了金牌!”一石激起千层浪。
这是人类最强数学天才们的战场,一直以来被誉为“数学界奥运”。现在,AI 竟然成功“混进来”,还拿了金牌?
但别急着鼓掌,这件事很快被爆出“翻车”隐患。

组委会震惊:不是说好一周后才能公布吗?
有内幕人士爆料——IMO 组委会其实早就给各家AI公司提了要求:不要在闭幕式前公布结果,最好等一周后。
为什么?
- 为了不抢人类参赛学生的风头
- 给官方充足时间验证AI提交的答案格式和内容
但 OpenAI 公告发得太快,快到评审团和协调员都没来得及评分。IMO 两届金牌得主、也是组委会成员的 Joseph Myers 表示:OpenAI 根本没通过我们 91 位协调员的评分流程。
结果,一场技术突破,变成了“规矩之争”。
谷歌 DeepMind:我们分也拿到了,但低调是美德
与 OpenAI 的高调不同,谷歌 DeepMind 和字节的 Seed 团队也在比赛中获得金牌,但却选择默默等待官方评估结束。
数学AI领域新锐初创公司 Harmonic 明确表示:“IMO 董事会明确要求各家AI团队要在 7 月 28 日之后再发布结果,这是对学生的尊重。”
谷歌 DeepMind 的推理负责人 Thang Luong 也站出来提醒:
“IMO 是有官方评分标准的,但并未公开。如果没用它来评分,就不能擅自宣布得奖。”
换句话说:你说自己是金牌,那也得我们说了才算。

OpenAI 得分有争议?金牌变银牌只是“一分之差”
这事还没完,IMO 金牌得主 Jasper 给出了更扎心的分析:
- IMO 题目共 6 题,每题满分 7 分,总分 42;
- 金牌线是 35 分,银牌 28 分;
- OpenAI 公布的成绩刚好是 35 分,只要哪怕扣掉一分,金牌就没了!
根据 Jasper 的判断:OpenAI 给出的答案格式可能无法满分通过——这就意味着,他们的“金牌”,很可能只是银牌。
而数学大神陶哲轩也指出:比赛的测试形式至关重要,不是“写对”就够了,还得“写得对”。

OpenAI回应:没人明确说不能发啊
面对争议,OpenAI 的回应来了:
- 研究员 Noam Brown 表示:“我们是在闭幕式之后发的结果,而且我提前咨询过 IMO 的一位组织者。”
- “也没人明确告诉我们,得等一周。”
但更令人侧目的回应是:“我们其实并没有正式参赛。”
什么意思?
OpenAI 还透露,IMO 曾联系他们提供 Lean 格式(数学机读证明格式),但被拒绝。换句话说,他们没有按照 IMO 要求提交完整材料。
于是,网友们炸锅了:
“既然没参赛,哪来的金牌?” “这不是擅自贴奖牌吗?”
技术突破,还是“舆论操盘”?
从技术角度看,AI 模型能达到 IMO 金牌水平,本身就是巨大的里程碑,代表着AI 正在攻克严密推理与结构化证明领域。
但从此次争议来看,OpenAI 的“抢跑”操作,也让人对其动机产生怀疑——是真自信,还是营销策略?
毕竟,在大模型商业化进入白热化阶段后,谁的技术领先一步、谁先刷存在感,意味着可能争取更多资源与关注。
结语:AI闯奥赛,我们该如何看待?
不可否认,OpenAI 和 DeepMind 的成绩都令人惊艳。
但技术突破归技术,比赛规则归规则。
金牌的意义,不只是分数线上的胜负,更是尊重、规范和公平。
当AI能与顶尖高中生比肩,我们更要比的是态度与底线。
那么问题来了——
你认为:OpenAI 的做法,是抢跑,还是合理宣传?
欢迎留言,我们评论区见!
本文由开放猫和子木联合共创,往期资料,回复“开放猫AI"添加下方二维码免费领取。