星際AI大賽戰(zhàn)況:Facebook輸了 中國團隊進入前四
發(fā)帖時間:2025-11-22 09:37:37
導(dǎo)讀:Facebook的星際人工智能團隊至少已有80余人,帶領(lǐng)這個團隊的大賽隊進是大名鼎鼎的Yann LeCun,他們已經(jīng)發(fā)表了很多研究和論文(其中三篇與星際爭霸有關(guān))。戰(zhàn)況上海包養(yǎng)外圍上門外圍女上門外圍上門外圍女(電話微信181-8279-1445)提供1-2線熱門城市快速安排30分鐘到達但目前Facebook在人工智能領(lǐng)域還沒有取得AlphaGo那樣的輸中成就。
第八屆星際爭霸AI大賽(StarCraft AI Competition)終于落下帷幕。國團
這次大賽選用的入前版本是《星際爭霸:母巢之戰(zhàn)》,開啟戰(zhàn)爭迷霧。星際所有參賽的大賽隊進AI在16臺虛擬機上,1v1捉對廝殺,戰(zhàn)況為期兩周共進行41580場大戰(zhàn)。輸中按照最終的國團勝率排定座次。
每局比賽60分鐘,入前未分高下時得分多者勝出。星際作弊或者計算超時都會被判出局。大賽隊進
共有28支隊伍參賽,戰(zhàn)況其中有15支屬于獨立戰(zhàn)隊(Independent),其他基本來自大學(xué):
美國哈佛大學(xué)、荷蘭代爾夫特理工大學(xué)、上海包養(yǎng)外圍上門外圍女上門外圍上門外圍女(電話微信181-8279-1445)提供1-2線熱門城市快速安排30分鐘到達瑞典皇家理工學(xué)院、荷蘭馬斯特里赫特大學(xué)、巴西米納斯聯(lián)邦大學(xué)、日本筑波大學(xué)、加拿大紐芬蘭紀(jì)念大學(xué)、法國南特大學(xué)、法國高等信息工程師學(xué)院、日本立命館大學(xué)、韓國世宗大學(xué)。
還有三個隊伍是量子位格外關(guān)注的。
比方說中國團隊。
其中以獨立戰(zhàn)隊身份參賽的“CPAC”,背后是一個Junge Zhang領(lǐng)銜的13人研發(fā)團隊,來自中科院自動化研究所;這個星際AI基于Steamhammer bot,然后增加了一些新的策略,并通過機器學(xué)習(xí)的方式訓(xùn)練了一個多層感知網(wǎng)絡(luò)來生產(chǎn)戰(zhàn)斗部隊。
(Steamhammer bot 傳送門:http://satirist.org/ai/starcraft/steamhammer/)
還有一個中國團隊由Tang Zhentao領(lǐng)銜,代號“KillAll”,據(jù)推測應(yīng)該是來自中科院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點實驗室;不過相關(guān)信息實在是太少。
另一個值得關(guān)注的隊伍是“CherryPi”(櫻桃派),背后是來自Facebook人工智能研究實驗室的八人團隊。
最終的戰(zhàn)果:不隸屬于任何機構(gòu)的獨立戰(zhàn)隊們,包攬前三名。
CPAC以71%的勝率排名第四;CherryPi以69.08%的勝率排名第六;KillAll以43%的勝率排名第18。第一名“ZZZKBot”勝率83.11%,平均用時8分鐘。
這幾位AI用的都是蟲族。
Facebook的團隊,在這個大賽中顯得有些異類,畢竟這是唯一有企業(yè)背景的選手,而且是一個押注AI已久的科技巨頭。
科技巨頭的AI殺入星際爭霸并不稀奇。今年8月,Google旗下的DeepMind宣布進軍星際,不過他們選擇的方向是《星際爭霸2》。
看起來,星際爭霸已經(jīng)成為巨頭爭霸的下一個戰(zhàn)場。
Facebook的人工智能團隊至少已有80余人,帶領(lǐng)這個團隊的是大名鼎鼎的Yann LeCun,他們已經(jīng)發(fā)表了很多研究和論文(其中三篇與星際爭霸有關(guān))。但目前Facebook在人工智能領(lǐng)域還沒有取得AlphaGo那樣的成就。
而這次參賽成績也表明,F(xiàn)acebook還有很長的一段路要走。
Facebook研究科學(xué)家Gabriel Synnaeve表示,他們把CherryPi當(dāng)做一個基線,以及未來繼續(xù)在星際領(lǐng)域進行研究的基礎(chǔ),“我們想看看它與現(xiàn)有bot相較如何,特別是測試一下是否有需要糾正的缺陷”。
人工智能對于科技公司的重要性已經(jīng)不言而喻,而星際對于AI研究的重要性和挑戰(zhàn),不僅僅是指揮戰(zhàn)斗這么簡單。與下圍棋這件事相比,《星際爭霸》的復(fù)雜性要大得多也要困難得多。
即便DeepMind現(xiàn)在也沒有突破性的進展。
星際2是個實用的基礎(chǔ)AI研究環(huán)境,因為游戲本身復(fù)雜多變,且勝利方式不固定。
玩家想要取勝需要同時做多手準(zhǔn)備,比如管理并創(chuàng)造資源、指揮軍事單位和部署防御結(jié)構(gòu)等操作需要同時進行,逐步完成。此外,玩家還需預(yù)測對手的策略。
這項任務(wù)確實不容易,但不是無解。DeepMind和暴雪嘗試將游戲分為多個“迷你游戲”,將不同任務(wù)分解成“可管理的組塊”,比如建立特定單元、收集資源或在地圖上移動等。
細分是為了方便研究人員進行不同任務(wù)的測試比較及細化,最終在智能體中組合,從而教會智能體通關(guān)整個游戲。
為啥這個大賽沒用星際2?好像是沒跟暴雪爸爸談好……
回到這次的星際爭霸AI大賽,獨立參賽的隊伍,通常bot背后是程序員制定的規(guī)則和策略。比如摘得冠軍的ZZZKBot,背后是澳大利亞的程序員Chris Coxe。他獨自創(chuàng)建了這個AI,但其中只有一些簡單的學(xué)習(xí)功能,背后更多是各種預(yù)先編輯好的策略。
而對于科技巨頭來說,他們更多的依靠機器學(xué)習(xí),通過積累大量的游戲數(shù)據(jù),讓AI自己制定相應(yīng)的游戲策略。不過據(jù)說這次Facebook也沒有把全部研究都注入CherryPi之中。盡管如此,CherryPi還是獲得了對手的肯定,獲得第二名的PurpleWave作者就表示,CherryPi對時機的把握讓他印象深刻。
那么獲勝的隊伍都依靠了什么策略和技術(shù)?量子位也簡單介紹一下。
第一名:ZZZKBot
蟲族,單基地Rush布局:4-Pool,Speedling,Hydra,Muta。使用手工編碼的邏輯,來進行策略選擇。
這個bot其實只能執(zhí)行一種單基地Rush戰(zhàn)術(shù),單它的對手現(xiàn)在比較吃這一套。另外,這個bot能在游戲中學(xué)習(xí)一些策略,以判斷哪種rush是最有效的。以及,這個bot幾乎沒有掌握任何戰(zhàn)斗中的微操作。
“這原本只是想證明一個概念”,作者Chris Coxe自我評價:“源代碼并不是那么好”。
第二名:PurpleWave
這個bot主要是用Scala寫出來的,作者是美國軟件工程師Dan Gant,他今年一月開始啟動這個項目。
PurpleWave看起來比第一名更為“AI”一點;會微操作,有多種不同的策略。PurpleWave的高級決策被構(gòu)建為一個任務(wù)網(wǎng)絡(luò),它能根據(jù)對手以往的比賽情況,選擇不同的對抗策略。
第三名:Iron
這是去年的冠軍,作者是法國程序員Igor Dimitrijevic。Iron于2016年開始研發(fā),前身是2015年參賽的Stone。
Iron是一個多智能體系統(tǒng),每個智能體控制一個單位。整體行為的魯棒性是其主要目標(biāo),每個智能體都是高度自主的,可以在25種行為之間切換。每場對決,Iron都采用相同的開局,但對根據(jù)對手的情況進行反應(yīng)和修改策略。
第四名:CPAC
團隊名單:Junge Zhang,Xun Zhang,Qiyue Yin,Dong Zhan,Shihong Deng,Huikai Wu,Peixi Peng,Wenzhen Huang,Jing Kong,Debang Li,Yange Fang,Tairan Zhang,Junliang Xing。
CPAC是首次參賽,整個研發(fā)耗時數(shù)月。其他情況開頭也介紹過了。
最后說一下這個大賽的情況。
星際爭霸AI大賽,是加拿大紐芬蘭紀(jì)念大學(xué)David Churchill組織的年度活動。這個比賽的目的是促進和評估即時戰(zhàn)略游戲(RTS)對人工智能的意義。
整個比賽使用BWAPI,這是一種可以讓AI程序控制《星際爭霸:母巢之戰(zhàn)》的軟件庫。