熱門文章
相關(guān)文章
- 1深圳入選中國(guó)首批13個(gè)交通強(qiáng)國(guó)
- 2智慧城市如何改變生活?
- 3堅(jiān)持法治引領(lǐng)交通強(qiáng)國(guó)建設(shè)
- 4四大領(lǐng)域22項(xiàng)任務(wù)試點(diǎn)交通強(qiáng)國(guó)
- 5日本東京大學(xué)攜手軟銀打造人工智
- 6工信部副部長(zhǎng):開展5G區(qū)塊鏈等
- 7工信部趙志國(guó):今年中國(guó)網(wǎng)絡(luò)安全
- 8交通部開展第二批交通強(qiáng)國(guó)建設(shè)試
- 9治理“城市病”,如何對(duì)癥下藥?
- 10城市精細(xì)化治理不能忽視的關(guān)鍵點(diǎn)
一座新的里程碑——人工智能在6人德州撲克中獲勝
發(fā)布時(shí)間:2019-07-17 分類:趨勢(shì)研究 來源:科技日?qǐng)?bào)
據(jù)美國(guó)《新聞周刊》網(wǎng)站近日?qǐng)?bào)道,美國(guó)科學(xué)家開發(fā)出一種新的人工智能(AI)程序“合眾為一”(Pluribus),其在6人無限制德州撲克比賽中擊敗了6名全球頂尖選手。研究人員認(rèn)為,這是人工智能發(fā)展史上的一座里程碑,未來有望應(yīng)用于生物醫(yī)學(xué)、安全等領(lǐng)域。研究發(fā)表于12日出版的《科學(xué)》雜志。
Pluribus由Facebook人工智能實(shí)驗(yàn)室和卡耐基梅隆大學(xué)的研究人員攜手完成。在游戲中,Pluribus和職業(yè)選手共進(jìn)行了10000手撲克牌比賽。在一種情況下,人工智能面對(duì)5名人類選手;在另一種場(chǎng)景中,5個(gè)版本的人工智能與一名人類選手對(duì)決(AI沒有相互配合)。研究人員發(fā)現(xiàn),Pluribus的表現(xiàn)明顯優(yōu)于人類。他們認(rèn)為,這是“決定性的勝利”。
研究報(bào)告共同作者、卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)教授托馬斯·桑德霍爾姆博士素有“德州撲克AI之父”的美譽(yù),他表示:“在AI領(lǐng)域(至少自1970年以來)和博弈論領(lǐng)域(至少?gòu)?950年開始),撲克是測(cè)試非完美信息游戲解決能力的主要基準(zhǔn)?!?
桑德霍爾姆解釋說,人工智能已經(jīng)在國(guó)際象棋、跳棋、圍棋、雙人限制和雙人無限制撲克等雙人零和游戲中擊敗了人類。在雙人零和游戲中,只能有一方可以獲勝,用博弈論的術(shù)語(yǔ)來講,這些人工智能所做的都是在找到一個(gè)接近納什均衡的策略。所謂納什均衡策略就是指一系列能夠使自己預(yù)期收益最大化的策略。但由于六人游戲規(guī)模大,人數(shù)多,上述辦法很難擴(kuò)展到六人游戲。
因此,研究人員需要找到一種方法來擺脫納什均衡,桑德霍爾姆解釋道:“這種策略計(jì)算起來要困難得多,但最新算法‘強(qiáng)大且可擴(kuò)展’,最新勝利‘是AI在多玩家游戲領(lǐng)域的第一個(gè)里程碑’?!?
桑德霍爾姆表示,這一研究所涉及的戰(zhàn)略推理技術(shù)未來有望在多個(gè)領(lǐng)域“大顯身手”,從撲克、視頻游戲到投資銀行的戰(zhàn)略優(yōu)化、政治運(yùn)動(dòng)等,不一而足,其還可以引導(dǎo)進(jìn)化和生物學(xué)適應(yīng)——例如醫(yī)療計(jì)劃和合成生物學(xué)等。此外,該技術(shù)還可用于電子戰(zhàn)、安全領(lǐng)域等。
結(jié)語(yǔ)
谷歌的“阿爾法狗”在圍棋對(duì)弈中大敗李世石后,有人指出:別著急,人工智能還沒打贏多人德州撲克呢。能在一對(duì)一的博弈中獲勝,確實(shí)是人工智能的重要成就。不過,現(xiàn)實(shí)生活中很多競(jìng)爭(zhēng)場(chǎng)景并非雙人對(duì)決,而是多人參與,股票投資、職位競(jìng)選、招投標(biāo)活動(dòng)等等就是如此。因此人工智能在6人德州撲克中獲勝,是一座新的里程碑。在此基礎(chǔ)上,人工智能有可望為多人競(jìng)爭(zhēng)的更為復(fù)雜的現(xiàn)實(shí)場(chǎng)景,提供最優(yōu)解決方案,從而勝任更多任務(wù)。