德州撲克人機(jī)大戰(zhàn)前 我們和它背后的AI專家長談了一番

來源:網(wǎng)絡(luò) 時(shí)間:2017-03-30 17:49:19

德州撲克人機(jī)大戰(zhàn)前 我們和它背后的AI專家長談了一番

2015年創(chuàng)新工場CEO李開復(fù)(微博)獲卡內(nèi)基梅隆大學(xué)頒給榮譽(yù)博士畢業(yè)演講前,與計(jì)算機(jī)學(xué)院院長Andrew Moore合影(中:李開復(fù)/右:Andrew Moore)

文/騰訊科技 孫實(shí)

近日,一條關(guān)于“人機(jī)大戰(zhàn)”的新聞刷遍了朋友圈。這次不是比賽圍棋,而是德州撲克。

2017年4月6日至10日,由創(chuàng)新工場CEO李開復(fù)發(fā)起,邀請母校美國卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)知名的Libratus撲克機(jī)器人主創(chuàng)團(tuán)隊(duì)訪問中國,于海南進(jìn)行一場“冷撲大師v.s.中國龍之隊(duì)—人工智能和頂尖牌手巔峰表演賽”,對陣由中國撲克高手杜悅帶領(lǐng)的“中國龍之隊(duì)”,這也是亞洲首度舉辦的人工智能與真人對打的撲克賽事。

在比賽前夕,騰訊科技也專訪到卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)學(xué)院院長Andrew Moore,就冷撲大師的算法、應(yīng)對德州撲克心理戰(zhàn)、未來商業(yè)化等話題進(jìn)行了交流。

冷撲大師的基礎(chǔ)是大量的數(shù)學(xué)計(jì)算

眾所周知,心理戰(zhàn)是德州撲克相當(dāng)重要的一部分,除去無法控制的運(yùn)氣,和累積經(jīng)驗(yàn)下來的技術(shù),剩下就是心理層面的,這也是德州有趣的地方。所以,通過對手的動作表情判斷對手牌的強(qiáng)弱,是德州撲克相當(dāng)重要的一種游戲技巧,而冷撲大師作為一個(gè)冷冰冰的人工智能系統(tǒng),是如何應(yīng)對人類棋手復(fù)雜的心理戰(zhàn)呢?

對于騰訊科技的這個(gè)疑問,Andrew Moore表示,冷撲大師并沒有用到任何心理戰(zhàn)的機(jī)制,完全用的是大量的數(shù)學(xué),實(shí)際算法并不是讓機(jī)器學(xué)習(xí)所謂“詐和”的招數(shù),而且是算出詐和的數(shù)量要在多少才是最為優(yōu)化的,多一點(diǎn)還是少一點(diǎn)才能產(chǎn)生最高的勝率。

和AlphaGo有哪些不同?

作為知名的人工智能系統(tǒng),冷撲大師免不了會與AlphaGo進(jìn)行一番比較。Andrew Moore認(rèn)為,其實(shí)撲克比圍棋來說,游戲規(guī)則相對簡單,但具有大量的隱藏信息。圍棋沒有隱藏信息,但是每一步必須進(jìn)行很深、很廣的搜索。在撲克上面,難處在于有非常多不同的詐和招數(shù),程序必須每招去一一進(jìn)行檢查。撲克AI并沒有用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)這兩種技術(shù),反倒是用了一種比較古典的線性規(guī)劃。

助力談判博弈或是商業(yè)化前景

任何一種技術(shù),最終肯定是要服務(wù)人類、幫助企業(yè)盈利,關(guān)于冷撲大師的商業(yè)計(jì)劃,Andrew Moore表示,他自己最喜歡的一個(gè)商業(yè)應(yīng)用是在所謂的企業(yè)交易或者是企業(yè)談判,未來貨物的供需或者貨物的交易,可以更快地用這種AI驅(qū)動的商業(yè)談判算法來進(jìn)行,甚至可以通過AI去摸清談判對象的底線和談判邏輯。

以下為騰訊科技整理的專訪實(shí)錄:

騰訊科技:打德州撲克很重要的一個(gè)因素是心理戰(zhàn),我想知道在心理戰(zhàn)當(dāng)中人工智能如何發(fā)揮作用的?

Andrew Moore:我們CMU學(xué)校所研發(fā)的人機(jī)撲克對戰(zhàn),背后并沒有用到任何心理戰(zhàn)的機(jī)制,完全用的是大量的數(shù)學(xué)。所以舉撲克中的詐和,實(shí)際演算法里面并不是讓機(jī)器學(xué)詐和的招數(shù),而且是算出詐和的數(shù)量要在多少才是最為優(yōu)化的,多一點(diǎn)詐和還是少一點(diǎn)詐和才能產(chǎn)生最高的勝率,背后還是數(shù)學(xué)。

騰訊科技:未來冷撲大師AI商業(yè)化的運(yùn)作怎么樣?除了通過打德州撲克驗(yàn)證了它處理不完美信息的能力,未來商業(yè)化最終的目的是什么?

Andrew Moore:我自己最喜歡的一個(gè)商業(yè)應(yīng)用是在所謂的企業(yè)交易或者是企業(yè)談判,未來貨物的供需或者貨物的交易,可以更快地用這種AI驅(qū)動的商業(yè)談判算法來進(jìn)行。

騰訊科技:是指在談判過程當(dāng)中根據(jù)大數(shù)據(jù)得出對方的底價(jià),或者推敲對方議價(jià)的邏輯嗎?

Andrew Moore:是的,這個(gè)過程當(dāng)中的商業(yè)談判就可以被自動化,AI會驅(qū)動自動化時(shí)代的到來。

問:撲克機(jī)器人最大的亮點(diǎn)是可以處理信息,也學(xué)會隱藏信息,是不是意味著電腦很快有一天也能夠?qū)W會主動隱藏信息,如果這樣的事情發(fā)生,這樣會不會讓人們覺得非常的恐懼跟擔(dān)憂?

Andrew Moore:我分兩部分回答這個(gè)問題,第一部分關(guān)于現(xiàn)在我們CMU在研發(fā)的AI談判技術(shù),其中一部分是關(guān)于隱藏事實(shí)。其中一個(gè)領(lǐng)域是關(guān)于拍賣或者競標(biāo)的形式,現(xiàn)在競拍的形式在很多地方都已經(jīng)被廣泛應(yīng)用了,比如說廣告的競價(jià)排名,甚至一些物流運(yùn)輸業(yè)行業(yè)也用到競拍競標(biāo)的機(jī)制,競拍中間的過程其實(shí)相對是復(fù)雜的,雙方要經(jīng)過序列式的猜測,我先猜你再猜,所以有一個(gè)順序性的隱藏信息在逐步被揭露。

現(xiàn)在有一個(gè)非常聰明的機(jī)制,這個(gè)聰明的機(jī)制基于不同于傳統(tǒng)競標(biāo)方式的一個(gè)演算法,叫做第二價(jià)格競拍,但目的是為了去贏得這個(gè)競拍,研究出來最好的策略是永遠(yuǎn)保持誠實(shí)。這個(gè)機(jī)制當(dāng)中,科學(xué)家在發(fā)明AI談判算法的時(shí)候所用的策略就是盡可能地促使每一個(gè)參與者都說實(shí)話,第二價(jià)格競拍其實(shí)在傳統(tǒng)拍賣行業(yè)中不是一個(gè)新制度,但在AI領(lǐng)域反而促進(jìn)了全新發(fā)明。

第二部分說明,是有關(guān)對抗所有的網(wǎng)絡(luò)攻擊或者垃圾郵件的技術(shù)。所有電子郵箱的服務(wù)供應(yīng)商過往都投注大量資源研發(fā)各種方法來阻擋垃圾郵件,但是他們絕對不能公布這些方法,一旦公布很快就會被破解了,被想攻擊的不法分子所用。對于所謂的“壞蛋”,我們反而是需要一些被隱藏的演算法來欺騙他們,不告訴他們實(shí)話。

你問到科學(xué)家在做的算法或者所發(fā)明的程序,會不會有一天自己有學(xué)習(xí)能力反過來欺騙了人類?我的回答是,在現(xiàn)階段還沒有什么方式會促使電腦自己產(chǎn)生動機(jī)去做這件事情,現(xiàn)階段的技術(shù)領(lǐng)域,電腦沒有辦法自行產(chǎn)生一個(gè)動機(jī)想去欺騙人。

問:AI圍棋和AI撲克有什么不同?AI撲克是否用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)?

Andrew Moore:其實(shí)撲克比圍棋來說,游戲規(guī)則相對簡單,但具有大量的隱藏信息。圍棋沒有隱藏信息,但是每一步必須進(jìn)行很深、很廣的搜索。在撲克上面,難處在于有非常多不同的詐和招數(shù),程序必須每招去一一進(jìn)行檢查。撲克AI并沒有用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)這兩種技術(shù),反倒是用了一種比較古典的線性規(guī)劃(linear programming)。

問:請您談?wù)剬τ谥袊鳤I市場的看法,以及AI技術(shù)在中國市場的潛力。

Andrew Moore:我對于現(xiàn)在在中國市場對AI領(lǐng)域有這么熱切的投資興趣非常認(rèn)同,更重要的是,我們看到AI能夠很實(shí)質(zhì)在不同產(chǎn)業(yè)被大量導(dǎo)入在自動化領(lǐng)域,很多現(xiàn)在的產(chǎn)業(yè)運(yùn)作方式會被大量的自動化。我個(gè)人對于去發(fā)展一些平臺式技術(shù)不那么感興趣,我更感興趣的是一些特定垂直領(lǐng)域的解決方案,特別是能在實(shí)際生活或商業(yè)上被用到的場景,所以我也鼓勵中國的創(chuàng)業(yè)者,盡量設(shè)定特定垂直領(lǐng)域的一些應(yīng)用發(fā)展。

比如說兩個(gè)例子,一個(gè)是某個(gè)創(chuàng)業(yè)者針對有自閉癥的孩子去研發(fā)一種新的解決方案,這就非常棒。但是如果只是平臺式思維想要讓機(jī)器學(xué)習(xí)更精進(jìn)那么一點(diǎn)點(diǎn),就不怎么吸引我。

繼續(xù)閱讀與本文標(biāo)簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開微信,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。