人工智能領域面臨極化,巨頭實驗室或將主宰AI未來
國際象棋和圍棋曾是孩子的游戲。現在AI正在贏得奪旗游戲。這些技能最終會轉化到現實世界嗎?
孩子們會在夏季營地開放空間玩奪旗這個游戲;同時,爭奪旗子這個游戲畫面也是Quake III和Overwatch等熱門游戲的一部分。
無論是哪種情況,這都是一項團隊運動。每一方都守衛一面旗幟,同時還要計劃如何抓住對方的旗幟并將其帶回到自己的大本營。贏得比賽需要良好的老式團隊合作以及協調防守和攻擊之間的平衡。
換句話說,奪得旗幟需要一套看起來似乎只有人工才能操作的技能。但倫敦一家人工智能實驗室的研究人員表明,機器也可以攻克這項游戲,至少在虛擬世界中是可以的。
在五月三十日發表在《科學》雜志上的一篇論文中,研究人員稱他們在Quake III游戲的奪旗環節中設計了自動“代理人”,這些“代理人”表現的就跟人類在操作一樣。這些代理人能夠自行組隊來對抗人類玩家,也可以與他們并肩作戰,根據情況相應地調整自己的行為。
隸屬于Alphabet的DeepMind實驗室的研究員Wojciech Czarnecki表示:“這些代理人可以適應具有任意技能的隊友。”
通過數千小時的游戲,代理人學會了非常特殊的技能,比如在隊友即將獲得旗幟的情況下極速跑去攻擊對手的大本營。正如人類玩家所知,當對方旗幟被奪得并帶到自己的大本營時,對家的大本營中會出現一面可以搶奪的新旗。
DeepMind的項目是努力構建人工智能應用于復雜三維動畫游戲的一部分,這些三維動畫游戲包括Quake III、Dota 2和星際爭霸II。許多研究人員認為:虛擬領域的成功最終將提升現實世界中人工智能的應用能力。
例如,這些技能可以使倉庫機器人受益——當他們分組工作將貨物從一個地方移動到另一個地方時,或者幫助自動駕駛汽車在交通擁堵時集中導航。位于舊金山的OpenAI實驗室有著類似研究項目,項目負責人Greg Brockman說道:“游戲一直是AI的基準。如果不能攻克游戲難題,就不能指望AI解決其他問題。”
直到最近,在像Quake III這樣的游戲中構建一個可以匹配人類玩家的系統才成為可能,以前看來似乎是不可能的。但是在過去的幾年里,DeepMind、OpenAI以及其他實驗室取得了重大進展,這要歸功于一種稱為“強化學習”的數學技術,這種技術使得機器能通過極端的反復試驗和試錯來學習。
通過一遍又一遍地玩游戲,這些自動代理人可以了解哪些策略能成功,哪些策略不成功。如果代理人在隊友即將奪旗的情況下通過向對手的大本營移動而不斷贏得更多積分,則會將這種策略添加到他的游戲策略中。
在2016年,同樣使用這項基礎技術,DeepMind研究人員構建了使得AlphaGo在東方圍棋游戲中擊敗世界頂級玩家的系統。鑒于圍棋游戲的巨大復雜性,許多專家曾認為這種突破不會這么早實現,而是起碼將在未來十年內完成。
尤其是當涉及到隊友之間的協調時,第一人稱視頻游戲的復雜程度是呈指數級的增長的。DeepMind的代理人通過大約45萬輪游戲來學習如何奪得旗幟,在數周的訓練中便積累了需要大約4年的游戲經驗。起初,代理人慘遭失敗。但通過學習突襲對手大本營時應該如何追隨隊友,他們逐漸了解到了這個游戲的精髓。
在完成這個項目以后,DeepMind的研究人員還設計了一個可以擊敗星際爭霸II專業玩家的系統。在OpenAI實驗室,研究人員構建了一個掌握Dota 2的系統,Dota 2這個游戲就像奪得旗幟的加強版本。今年四月,由五名代理人組成的團隊擊敗了由五名世界上最優秀的人類玩家組成的玩家團隊。
去年,人稱Blitz的專業Dota 2玩家兼評論員William Lee與代理人進行過一對一比賽,當時的版本不允許團隊戰;在當時,William對此表示興趣平平。但是當代理人繼續學習比賽并且參加團隊戰時,他對代理人的技巧感到震驚。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













