
德州撲克也成了AI的天下
北京時(shí)間2月1日消息,據(jù)科技網(wǎng)站TechRepublic報(bào)道,雖說(shuō)位于匹茲堡的河流賭場(chǎng)與科技突破這一名詞有些不搭,但本周二它確實(shí)見(jiàn)證了卡耐基梅隆大學(xué)的AI系統(tǒng)Libratus將四位德州撲克頂級(jí)選手?jǐn)芈漶R下。
Libratus是卡耐基梅隆大學(xué)計(jì)算機(jī)科學(xué)教授尚德洪姆與博士生布朗共同打造的,在為期20天的賽程中,它們一共進(jìn)行了12萬(wàn)手牌的比賽,最終Libratus戰(zhàn)勝了四位人類(lèi)頂尖高手,
“這是AI開(kāi)辟的新疆界,”尚德洪姆在賽后的新聞發(fā)布會(huì)上說(shuō)道。“也是AI在游戲比賽中獲得的里程碑式突破。”
Libratus的成功主要在于不斷學(xué)習(xí),每結(jié)束一天的比賽它都能學(xué)到人類(lèi)牌手的技巧并有所提升。“每天比賽結(jié)束后,Libratus內(nèi)置的原算法就會(huì)分析對(duì)手的漏洞和技巧,并將其融入到Libratus未來(lái)的牌路之中。”尚德洪姆說(shuō)道。
不過(guò),Libratus的方式與此前人機(jī)撲克大賽的思路有所不同,此前研究人員主要尋找對(duì)手的破綻并針對(duì)相應(yīng)破綻進(jìn)行各個(gè)擊破。Libratus則正相反,它尋找破綻的目的是要補(bǔ)漏,防止自己也出現(xiàn)同樣的破綻。
Libratus的勝利是AI逐步統(tǒng)治棋牌類(lèi)游戲的又一里程碑,1997年時(shí)IBM的深藍(lán)電腦在國(guó)際象棋比賽中擊敗世界冠軍卡斯帕羅夫,去年AlphaGo則成功在圍棋比賽中摘冠,而此前這項(xiàng)運(yùn)動(dòng)被認(rèn)為是直覺(jué)的游戲。與深藍(lán)電腦純靠計(jì)算能力有所不同的是,AlphaGo擁有強(qiáng)化學(xué)習(xí)的能力。
Libratus的勝利則象征著AI的另一個(gè)巨大突破,因?yàn)榈轮輷淇伺c圍棋預(yù)設(shè)的挑戰(zhàn)不同,它信息缺失的特性是此前AI從未觸碰過(guò)的。
杜克大學(xué)計(jì)算機(jī)教授科尼特茲也認(rèn)為AI擊敗德州撲克頂級(jí)選手是個(gè)巨大突破。“撲克是一個(gè)有關(guān)不完美信息的游戲,它與現(xiàn)實(shí)世界的戰(zhàn)略決策更加息息相關(guān),而這種特性在商業(yè)、政治、安全甚至社交生活中都能發(fā)揮直觀重要的作用。”
新南威爾士大學(xué)AI教授瓦爾斯也同意這一觀點(diǎn)。“從某些角度來(lái)看,德州撲克的難度甚至要超越國(guó)際象棋和圍棋,因?yàn)樗男畔⑷笔Х浅?yán)重。你不知道對(duì)手拿了什么牌或者即將打出什么牌,這就意味著變數(shù)的增多。此外,在撲克比賽中,選手們還會(huì)動(dòng)用心理戰(zhàn)虛張聲勢(shì)來(lái)影響對(duì)手的判斷。”
值得注意的一點(diǎn)是,雖然Libratus用的依舊是傳統(tǒng)的樹(shù)形搜索、抽象和游戲戰(zhàn)略分析等AI技術(shù),但我們現(xiàn)在并未完全了解Libratus的工作方式。
“AI的進(jìn)步可不止在深度學(xué)習(xí)上。”瓦爾斯補(bǔ)充道。
同時(shí),瓦爾斯認(rèn)為我們不能高興的太早,因?yàn)锳I并未徹底統(tǒng)治撲克界,眼下的比賽還是一對(duì)一,如果有更多選手加入進(jìn)來(lái),德州撲克的難度將會(huì)成倍增加。想在多人比賽中獲勝,AI恐怕還得多歷練幾年。
此外,Libratus與AlphaGo有相同的毛病,那就是它們只專(zhuān)精于一個(gè)領(lǐng)域。因此人類(lèi)不必?fù)?dān)心它們的覺(jué)醒,因?yàn)槌送鎿淇撕拖聡澹鼈兪裁炊疾粫?huì)。
圍棋和德州撲克之后,人工智能的下一站會(huì)是哪個(gè)游戲呢?