40題只答對14題,DeepMind的AI系統贏了圍棋輸了數學
日前,Alphabet旗下的DeepMind團隊讓AI系統當了一回“高中生”,并進行了一場同等程度的數學考試。
最終成績顯示,這個智能水平處于世界領先地位、曾經數度打敗圍棋頂尖選手的AI系統只答對了40道題中的14題。按照100分制,該AI系統只考了35分,遠遠不及格。
據了解,這40道題目中覆蓋了算術、幾何、概率、測量和微積分。而令人驚訝的是,AI系統甚至答錯了“1+1+1+1+1+1+1”這一題,給出了錯誤答案“6”,連小學生都不如。
對于這個錯誤答案是如何產生的,研究人員解釋稱,DeepMind神經模型最長可以計算出現次數6次以下的數值,但如果次數為7,就算不出來了。因為AI碰到同一數字出現多次,會認為輸入值是出錯的。然而較為奇怪的是,AI卻能算出更長的加法題目。對此,研究人員承認還找不出很好的解釋,但很有可能是因為AI神經網絡不斷觀察每道問題,從而做出正確的解答。
此外,當研究人員要求DeepMind在一長串數字中找出“位值”,它就能答得很好,因為它可以按數字大小排出順序,也能將小數四舍五入。只不過,這種數學題都是偏簡單的。
從整體結果來看,AI系統在考試中答錯的多是那些由碰上文字、加減乘除符號、函數等組成的問題,因為它看不懂這個問題,所以無法作答。這個問題也是過往考試中,AI系統一直面臨的問題。待這一問題得到解決,AI的“智力水平”或將能夠媲美中學生。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 特斯拉Optimus Gen3量產在即,哪些環節最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 4 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 5 Tesla AI5芯片最新進展總結
- 6 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 7 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 8 2026,人形機器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 10 AI Infra產業鏈卡在哪里了?


分享













