2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽(決賽)AI測試結(jié)果簡報(bào)

2025-12-15 14:36|編輯: 小李老師|閱讀: 25

摘要

在剛剛落幕的2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽（CMO）決賽中，不僅涌現(xiàn)出一批才華橫溢的數(shù)學(xué)新秀，更有一位特殊的“選手”引發(fā)廣泛關(guān)注——AI大模型首次亮相賽場，成為全場焦點(diǎn)。

102分勇奪奧數(shù)金牌！AI首戰(zhàn)CMO驚艷全場，全國僅兩位頂尖學(xué)霸成績更優(yōu)；其對(duì)第四題的解答更被專家譽(yù)為“前所未見的新解法”！自主選拔在線團(tuán)隊(duì)特整理2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽(決賽)AI測試結(jié)果簡報(bào)，一起來看

2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽(決賽)AI測試結(jié)果簡報(bào)

　　CMO是中國最高規(guī)格的數(shù)學(xué)奧林匹克競賽，今年，主辦方首次設(shè)立AI測試環(huán)節(jié)，邀請(qǐng)大模型與人類同場答題，并交由相同的評(píng)委專家組閱卷打分。上海人工智能實(shí)驗(yàn)室旗下的書生科學(xué)多模態(tài)大模型(Intern-S1-20251122)拿到102分。

　　據(jù)公開信息，今年CMO考生前三名得分分別為126(滿分)、110分、102分，Intern-S1取得的成績位列總分榜第三，在AI中排名第一。

　　本屆CMO共有700余名選手參賽，223人獲得金牌，前60名選手獲得清華北大保送資格并入選國家集訓(xùn)隊(duì)。AI目前雖未超越人類選手最高分，但其表現(xiàn)已遠(yuǎn)超大多數(shù)參賽者，甚至超過了許多金牌得主，本次金牌線為78分。

　　根據(jù)中國數(shù)學(xué)會(huì)出具的結(jié)果簡報(bào)，Intern-S1在本次競賽中，4道題目全對(duì)分別獲21分，2道題目由于“未證明最優(yōu)性”“部分不嚴(yán)格”得9分。

2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽(決賽)AI測試結(jié)果簡報(bào)

　　CMO的題目均為高難度證明題，需要模型具備嚴(yán)謹(jǐn)?shù)膹?fù)雜推理能力。但當(dāng)前大部分模型均聚焦于通過強(qiáng)化學(xué)習(xí)技術(shù)解決結(jié)果可校驗(yàn)的解答題，在證明題領(lǐng)域能力薄弱;且高難度數(shù)學(xué)問題的推理復(fù)雜度，已超出模型單次推理的可探索范疇。

　　以第四題為例：有30種顏色的紙牌，每種顏色的紙牌均有70張。開始時(shí)從這些紙牌中任意選取70張，并從上至下擺成一疊。接著進(jìn)行如下操作：從最下方20張紙牌中選擇一張紙牌 X，滿足其顏色在最上方50張紙牌中從未出現(xiàn);再從最上方50張紙牌中選擇一張紙牌Y，滿足其顏色在最上方50張紙牌中至少出現(xiàn)兩次;從這疊紙牌中抽出X并將其緊貼著Y的上方放回這疊紙牌中。稱上述過程為一次操作。重復(fù)上述操作直至無法選取這樣的紙牌X時(shí)，整個(gè)操作過程結(jié)束。

　　(1)證明：對(duì)所有可能的初始情況及操作方式，整個(gè)操作過程都會(huì)在有限次操作后結(jié)束;

　　(2)在所有可能的初始情況及操作方式中，求操作次數(shù)的最大可能值。

　　“考生”Intern-S1在規(guī)定時(shí)長內(nèi)不僅得出了正確的結(jié)論，還展示了清晰的回答思路。

　　閱卷專家評(píng)價(jià)Intern-S1：“答案表達(dá)方式非常接近人類”，其中對(duì)第四題的解答是“一個(gè)新的解法，巧妙的調(diào)整法，在學(xué)生的解法中沒有見過”——這標(biāo)志著Intern-S1不僅在表達(dá)邏輯的嚴(yán)謹(jǐn)性和推理能力方面達(dá)到專業(yè)級(jí)水準(zhǔn)，還能突破人類解題思路局限，通過自主探索和分析找到新的解題方法，為進(jìn)一步賦能科學(xué)發(fā)現(xiàn)夯實(shí)技術(shù)基礎(chǔ)。

此次在數(shù)學(xué)奧賽中取得佳績，并非上海AI實(shí)驗(yàn)室在科學(xué)領(lǐng)域的“首金”。就在上個(gè)月，該實(shí)驗(yàn)室的AI模型同樣經(jīng)受了2025年國際物理奧賽(IPhO)的考驗(yàn)，并拿下金牌，成為首個(gè)也是唯一獲得金牌的開源模型。接連攻克兩座基礎(chǔ)科學(xué)的“堡壘”，某種意義上標(biāo)志著AI正從單一任務(wù)的求解者，逐漸向具備跨學(xué)科能力的“全能科學(xué)家”演進(jìn)。

　　“AI在奧賽中超越人類是未來一定會(huì)發(fā)生的事。”上海人工智能實(shí)驗(yàn)室青年領(lǐng)軍科學(xué)家陳愷對(duì)第一財(cái)經(jīng)表示。他認(rèn)為，正如AlphaGo最終戰(zhàn)勝世界圍棋冠軍，AI在數(shù)學(xué)競賽上的進(jìn)步也是一個(gè)逐步發(fā)展的過程?，F(xiàn)在AI已經(jīng)能拿奧賽金牌了，未來超過奧賽頂尖的人類選手也大有可能。

　　“數(shù)學(xué)是推理能力的代表性領(lǐng)域，也是目前很多大模型團(tuán)隊(duì)重點(diǎn)投入優(yōu)化的方向之一，因此進(jìn)展相對(duì)更快。”不過，陳愷強(qiáng)調(diào)，奧賽只是數(shù)學(xué)里的一個(gè)任務(wù)，因此AI在奧賽中超過人類，并不意味著AI在數(shù)學(xué)或更廣泛的能力上就能超過人。

　　“數(shù)學(xué)是個(gè)很寬泛深?yuàn)W的領(lǐng)域，也有很多前沿的研究，在這方面AI還要更長的時(shí)間積累。”陳愷補(bǔ)充道。

　　AI在數(shù)學(xué)和推理領(lǐng)域的突破意味著什么?陳愷認(rèn)為，這對(duì)教育和科研領(lǐng)域的落地都會(huì)很有幫助，此外，數(shù)學(xué)能力也是復(fù)雜推理等各種能力的基礎(chǔ)，因此這一能力的提升和演進(jìn)能進(jìn)一步幫助大模型提升智力水平。