揭秘首個AI數學大賽:為防止人類替考AI“先交代”再交卷
北京時間4月15日上午8點,2024阿里巴巴全球數學競賽預選賽正式交卷,58個國家與地區的選手在線鏖戰48小時,更有來自全球知名高校院所與企業的563支隊伍使用AI作答,其中00后占比超50%。他們各顯神通,使用模型調優、AI Agent、提示詞工程等多種方式,推動AI構建更強大的數學能力。
阿里巴巴全球數學競賽組委會介紹,當前,AI已經在不少領域展現超越人類的能力,但在“人類智慧的皇冠”數學領域還頗為受限。因此,從2024年起,阿里巴巴全球數學競賽決定向AI開放,鼓勵探索AI的潛力上限,推動AI在數學領域的研究和應用創新。
在這場48小時的預選賽中,AI和人類選手共用一套試卷,題目包括選擇題、解答題與證明題。為了保證公平,防止“人類替考”,組委會制定了“賽前固定方案、賽中誠實答題、賽后復現總結”的三步走規則。因此,在正式開考之前,AI參賽團隊就需要完成模型的訓練或微調,并鎖定做題版本;如使用提示詞工程,也需要提前提交相應方案。
AI挑戰賽吸引了全球563支隊伍踴躍報名,主要來自全球知名高校院所與企業,包括北大、清華、牛津、中國科學院、AWS、字節跳動等,大多具有AI專業背景,也有部分來自數學、物理等專業。統計顯示,參賽隊伍中,00后占比超50%,年輕一代正在成為AI生力軍,用多種形式熱情探索AI的數學上限。他們有的在開源大模型的基礎上進行專項微調,讓AI從初等數學進階到高等數學;他們有的構建起AI Agent,結合提示詞工程來調用GPT-4等閉源模型,使得GPT-4的數學解題能力有大幅提升。
西南交通大學應用物理系的大四學生向勁宇是一名AI開發者,也是MetaGPT-MC小組貢獻者之一,這次他和多位開發者組隊參賽,使用GPT-4與Claude 3組成Muti-Agent的方案,讓AI分飾多個角色、相互驗證來完成答題步驟,改善了AI“一本正經的胡說八道”的通病,提升了AI做題的準確性。在AWS從事AI研究的毛帽,是數學專業的博士,已連續三年參賽,今年轉換身份,從人類選手轉為AI的競賽輔導員,與同事組成一支“豪華團隊”,集合了數學、統計、地球物理及機器學習背景的4名博士,希望能向人類選手們秀一把AI的實力。
由阿里巴巴公益、達摩院共同舉辦的阿里巴巴全球數學競賽,以不設報名門檻、趣味十足著稱,舉辦6屆以來不斷推陳出新,比如把螞蟻森林種樹、張師傅扭寬面等題目引入競賽,激發全民數學熱情。今年,這項賽事更是緊扣AI與數學融合的技術趨勢,首次向AI開放,不限選手是碳基還是硅基。(李記)
來源: 光明網
- 中央空調壓縮機燒毀故障維修方法03-24
- 餐館防火知識你了解嗎01-30
- 1三菱電機空氣能24小時服務熱線電話(三菱電機空調24小時服務熱線電話)
- 2比易安壁掛爐官方網站(比易安壁掛爐:高端品質,溫暖家居)
- 3智鎖神話指紋鎖全國服務電話(智鎖神話指紋鎖 全國服務電話)
- 4VIOMI智能鎖全國服務熱線(VIOMI智能鎖全國服務熱線,專注服務您)
- 5長虹液晶電視有聲沒有人什么原因(長虹液晶電視無聲,原因及解決方案!)
- 6力型防盜門全國統一服務熱線(如何選擇可靠的服務商)
- 7創維電源板32l03電源故障(創維32L03電源板故障解決方案:詳細步驟與技巧)
- 8格蘭仕空調24小時服務熱線官網(如何通過格蘭仕空調24小時服務熱線官網獲得快
- 9冰箱風扇時轉時不轉(怎樣解決風扇故障)。
- 10創瞳保險柜開鎖(創瞳保險柜開鎖:全面解析與技巧指南)
-
Stulz空調維修中心(如何選擇合適的Stulz空調維修中心以確保高效和專業的服務?
2024-08-24
-
尚佳空調維修中心(尚佳空調維修中心:如何確保您的空調系統得到專業且高效
2024-08-24
-
TOBEL空調廠家總部熱線電話(如何聯系TOBEL空調廠家總部以獲取熱線電話服務?
2024-08-24
-
日立63故障(日立63故障解決方案:全面診斷與有效修復策略)
2024-08-24