欧美黄片二区亚州伦伦在线|深夜福利亚洲一区|超碰人人模人人爽最新地址|大量精品视频在线|百深爱五月激情婷婷|www.欧美…黄…|国产毛片无码视频|强奸在线观看视频网站|亚洲欧美精选另类|日韩一区二区三区黄色片

自主選拔在線

登錄 | 注冊(cè)

2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽(決賽)AI測試結(jié)果簡報(bào)

2025-12-15 14:36|編輯: 小李老師|閱讀: 25

摘要

在剛剛落幕的2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽(CMO)決賽中,不僅涌現(xiàn)出一批才華橫溢的數(shù)學(xué)新秀,更有一位特殊的“選手”引發(fā)廣泛關(guān)注——AI大模型首次亮相賽場,成為全場焦點(diǎn)。

102分勇奪奧數(shù)金牌!AI首戰(zhàn)CMO驚艷全場,全國僅兩位頂尖學(xué)霸成績更優(yōu);其對(duì)第四題的解答更被專家譽(yù)為“前所未見的新解法”!自主選拔在線團(tuán)隊(duì)特整理2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽(決賽)AI測試結(jié)果簡報(bào),一起來看

推薦閱讀:2025年五大學(xué)科競賽賽程安排/考試試題/獲獎(jiǎng)名單匯總

2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽(決賽)AI測試結(jié)果簡報(bào)

  CMO是中國最高規(guī)格的數(shù)學(xué)奧林匹克競賽,今年,主辦方首次設(shè)立AI測試環(huán)節(jié),邀請(qǐng)大模型與人類同場答題,并交由相同的評(píng)委專家組閱卷打分。上海人工智能實(shí)驗(yàn)室旗下的書生科學(xué)多模態(tài)大模型(Intern-S1-20251122)拿到102分。

  據(jù)公開信息,今年CMO考生前三名得分分別為126(滿分)、110分、102分,Intern-S1取得的成績位列總分榜第三,在AI中排名第一。

  本屆CMO共有700余名選手參賽,223人獲得金牌,前60名選手獲得清華北大保送資格并入選國家集訓(xùn)隊(duì)。AI目前雖未超越人類選手最高分,但其表現(xiàn)已遠(yuǎn)超大多數(shù)參賽者,甚至超過了許多金牌得主,本次金牌線為78分。

  根據(jù)中國數(shù)學(xué)會(huì)出具的結(jié)果簡報(bào),Intern-S1在本次競賽中,4道題目全對(duì)分別獲21分,2道題目由于“未證明最優(yōu)性”“部分不嚴(yán)格”得9分。

2025年全國中學(xué)生數(shù)學(xué)奧林匹克競賽(決賽)AI測試結(jié)果簡報(bào)

  CMO的題目均為高難度證明題,需要模型具備嚴(yán)謹(jǐn)?shù)膹?fù)雜推理能力。但當(dāng)前大部分模型均聚焦于通過強(qiáng)化學(xué)習(xí)技術(shù)解決結(jié)果可校驗(yàn)的解答題,在證明題領(lǐng)域能力薄弱;且高難度數(shù)學(xué)問題的推理復(fù)雜度,已超出模型單次推理的可探索范疇。

  以第四題為例:有30種顏色的紙牌,每種顏色的紙牌均有70張。開始時(shí)從這些紙牌中任意選取70張,并從上至下擺成一疊。接著進(jìn)行如下操作:從最下方20張紙牌中選擇一張紙牌 X,滿足其顏色在最上方50張紙牌中從未出現(xiàn);再從最上方50張紙牌中選擇一張紙牌Y,滿足其顏色在最上方50張紙牌中至少出現(xiàn)兩次;從這疊紙牌中抽出X并將其緊貼著Y的上方放回這疊紙牌中。稱上述過程為一次操作。重復(fù)上述操作直至無法選取這樣的紙牌X時(shí),整個(gè)操作過程結(jié)束。

  (1)證明:對(duì)所有可能的初始情況及操作方式,整個(gè)操作過程都會(huì)在有限次操作后結(jié)束;

  (2)在所有可能的初始情況及操作方式中,求操作次數(shù)的最大可能值。

  “考生”Intern-S1在規(guī)定時(shí)長內(nèi)不僅得出了正確的結(jié)論,還展示了清晰的回答思路。

  閱卷專家評(píng)價(jià)Intern-S1:“答案表達(dá)方式非常接近人類”,其中對(duì)第四題的解答是“一個(gè)新的解法,巧妙的調(diào)整法,在學(xué)生的解法中沒有見過”——這標(biāo)志著Intern-S1不僅在表達(dá)邏輯的嚴(yán)謹(jǐn)性和推理能力方面達(dá)到專業(yè)級(jí)水準(zhǔn),還能突破人類解題思路局限,通過自主探索和分析找到新的解題方法,為進(jìn)一步賦能科學(xué)發(fā)現(xiàn)夯實(shí)技術(shù)基礎(chǔ)。

此次在數(shù)學(xué)奧賽中取得佳績,并非上海AI實(shí)驗(yàn)室在科學(xué)領(lǐng)域的“首金”。就在上個(gè)月,該實(shí)驗(yàn)室的AI模型同樣經(jīng)受了2025年國際物理奧賽(IPhO)的考驗(yàn),并拿下金牌,成為首個(gè)也是唯一獲得金牌的開源模型。接連攻克兩座基礎(chǔ)科學(xué)的“堡壘”,某種意義上標(biāo)志著AI正從單一任務(wù)的求解者,逐漸向具備跨學(xué)科能力的“全能科學(xué)家”演進(jìn)。

  “AI在奧賽中超越人類是未來一定會(huì)發(fā)生的事。”上海人工智能實(shí)驗(yàn)室青年領(lǐng)軍科學(xué)家陳愷對(duì)第一財(cái)經(jīng)表示。他認(rèn)為,正如AlphaGo最終戰(zhàn)勝世界圍棋冠軍,AI在數(shù)學(xué)競賽上的進(jìn)步也是一個(gè)逐步發(fā)展的過程?,F(xiàn)在AI已經(jīng)能拿奧賽金牌了,未來超過奧賽頂尖的人類選手也大有可能。

  “數(shù)學(xué)是推理能力的代表性領(lǐng)域,也是目前很多大模型團(tuán)隊(duì)重點(diǎn)投入優(yōu)化的方向之一,因此進(jìn)展相對(duì)更快。”不過,陳愷強(qiáng)調(diào),奧賽只是數(shù)學(xué)里的一個(gè)任務(wù),因此AI在奧賽中超過人類,并不意味著AI在數(shù)學(xué)或更廣泛的能力上就能超過人。

  “數(shù)學(xué)是個(gè)很寬泛深?yuàn)W的領(lǐng)域,也有很多前沿的研究,在這方面AI還要更長的時(shí)間積累。”陳愷補(bǔ)充道。

  AI在數(shù)學(xué)和推理領(lǐng)域的突破意味著什么?陳愷認(rèn)為,這對(duì)教育和科研領(lǐng)域的落地都會(huì)很有幫助,此外,數(shù)學(xué)能力也是復(fù)雜推理等各種能力的基礎(chǔ),因此這一能力的提升和演進(jìn)能進(jìn)一步幫助大模型提升智力水平。

加入五大學(xué)科競賽交流群,一起分享競賽資訊、試題

點(diǎn)擊進(jìn)群

聲明:本文信息來源于網(wǎng)絡(luò),由自主選拔在線團(tuán)隊(duì)(微信公眾號(hào):zizzsw)排版編輯,如有侵權(quán),請(qǐng)及時(shí)聯(lián)系管理員刪除。

0

收藏

分享到:

微信掃一掃分享

QR Code

微信里點(diǎn)“發(fā)現(xiàn)”

掃一下二維碼便可將本文分享至朋友圈

報(bào)錯(cuò)
2025年數(shù)學(xué)競賽2025年CMO試題2025數(shù)競決賽AI測試

2025年數(shù)學(xué)競賽全年賽事一覽2025-11-28

2026年綜合評(píng)價(jià)招生政策解讀匯總(掃盲系列合集)2025-12-16

2026年強(qiáng)基計(jì)劃報(bào)考指南與政策解讀合集(掃盲篇)2025-12-10

2026年高校少年班報(bào)考指南(掃盲篇)2025-12-10

沒有更多了

友情鏈接: