人機撲克大戰,人類又輸給了“EQ超強”機器
2017年4月10日,“冷撲大師VS中國龍之隊——人機撲克巔峰表演賽”經過五天賽事,冷撲大師最終以792327總記分牌的戰績獲勝,此次表演賽的200萬元獎勵歸屬冷撲大師。
稍有點了解德州撲克的人都知道,它不僅僅是邏輯的比賽,還是一場心理戰,人類的“狡詐”在此發揮得淋漓盡致。沒想到,比賽期間常常被“詐唬”得一愣一愣的,反是冠軍級真人牌手。
AI崛起!人類的最后一道防線到底在哪里?李開復也曾表示過,十年后世界上50%的工作都會被人工智能所取代,尤其是翻譯、記者、助理、保安、司機、銷售、客服、交易員、會計、保姆等工作,正在從事相關工作的你,顫抖了嗎?
人類對手眼里的AI賭神:有讀心術
由知名投資人、創新工場董事長李開復發起的這場德州撲克“人機大戰”,人類方由六位華人頂尖撲克選手組建,隊長杜悅曾在世界德州撲克大賽WSOP的無限注德州撲克賽事中獲得冠軍,AI方背后是美國卡內基梅隆大學托馬斯·桑德霍姆教授開發的玩無限德州撲克的人工智能程序Libratus,李開復給它取了個中文名字“冷撲大師”。
在德撲這件事上,冷撲大師沒有師父。研究人員只告訴它基本的德州撲克規則,然后讓它開始以自我對局的“左右互搏”方式學習這個撲克游戲。在投入實戰之前,冷撲大師自己對戰了幾百萬手牌,但并沒有研究過人類如何打德州撲克,也沒有和人類職業玩家有過交手。所以,這位AI賭神形成了一種與人類截然不同的牌風,或者說是“不按牌理出牌”。
比方說,德撲頂級高手通常會主動嘗試尋找對手的弱點,并展開攻擊,而冷撲大師是觀察人類發現了它什么弱點,然后有針對性地彌補和提升。
詐唬(bluff)也不是人教的,而是機器自己學會的。研究人員說:“詐唬是特別重要的技能,系統在學習中發現,如果有一手爛牌,直接詐唬能贏更多,所以它就學會了。”
和冷撲大師對戰過的人類對手對此感受最深。中國龍之隊隊長杜悅在談到五天的比賽感想時表示:“人工智能在對戰時不會受到情感、心理、體能等因素影響,且強大運算能力遠超人類大腦,不得不承認冷撲大師很多手牌打得令人拍案叫絕。”
龍之隊成員許朝軍也說出了類似感受:“AI有讀心術”。
冷撲大師與阿爾法狗誰更厲害?
圍棋和德撲代表了兩類完全不同的游戲,阿爾法狗和冷撲大師也在朝完全不同的兩個方向探索。
專家解釋說,計算機程序攻克這些棋類游戲的方法在本質上是一樣的:搜索。下每一步棋都是一個決策點,而計算機所做的,就是在每一個決策點上搜索勝率最大的那條路徑。黑白棋的搜索量只有10的十幾次方,國際象棋是10的四十幾次方,而圍棋的搜索量達到了驚人的10的170次方。
一盤德撲的決策點數量是10的160次方,要少于圍棋,但光靠搜索是打不了德撲的。桑德海姆由此跳出了在搜索量上的較量,對AI提出了另一個方向上的考驗:應對隱藏的信息。
冷撲大師的另一主要研究人員諾里·布朗在評論這兩大AI時表示,圍棋在“完美信息游戲”中屬于高難度水平,因而阿爾法狗也在搜索這個核心問題上取得了巔峰成就。而冷撲大師剛剛打開了“非完美信息游戲”的大門,對于解決隱藏信息這個問題來說,德撲AI只是個開始。
李開復則說,“其實各有利弊。就像人的大腦,有時有些人計算能力很強,有些人情商很強。一定程度你可以說阿爾法狗是個超級計算機器,IQ很強,可是我們覺得冷撲大師更多是EQ強,它在想你在想什么,讓你最低的機會能詐到它。我們現在看到人工智能經過德撲,加上圍棋,更全面了。”
延伸
除了下棋打牌,AI已來到生活里
李開復表示,這套人工智能撲克程序背后的模型將適用于需要用到戰略推理和多方談判的場景。他預計,十年內,從企業談判、商務談判、外交談判、甚至到生活面的房屋買賣談判,會部分或全面被人工智能取代。
阿爾法狗取得的研究成果也正在快速復制到各行各業,谷歌旗下開發阿爾法狗的DeepMind公司正用機器學習來管理數據中心,讓它比人管理的時候節電40%。DeepMind認為,這個神經網絡不只可以用于數據中心,具有一定的通用性,準備把它發展到發電廠、半導體制造等行業。
與谷歌DeepMind的應用方向類似,3月29日,阿里云宣布推出“醫療大腦”,定位為醫生助手,目前能夠提供支持的領域包括患者虛擬助理、醫學影像、精準醫療、藥效挖掘、新藥研發等,包括廣州醫科大學在內的傳統醫療機構已經在和阿里云進行相關合作。
廣州醫學院第一醫院院長何健行告訴記者:“中國醫院動不動就是過千床的診療,每天兩三百個病人拍CT,拍出來的資料也越來越多,人工智能的輔助未來有望幫助醫生降低誤診率。”目前阿里云“醫療大腦”通過算法的迭代,將查看病人身體照片的速度提升至秒級。
思考
人類的最后防線在哪里?
李開復預期,未來一兩年內AI最具發展前景的領域肯定是金融,“因為人工智能就是一個特別巨大的數據機器,什么東西最好用數據來做?一定是一個無摩擦的、純數據的、且數據量特別大的領域,而且是能夠靠數據調整就可以掙錢的,那一定是金融。金融里面分了放貸、銀行、投資、保險等等方面,在每一個領域都會開花結果。”
未來十年的話,李開復相信,世界上50%的工作都會被人工智能所取代,尤其是翻譯、記者、助理、保安、司機、銷售、客服、交易員、會計、保姆等工作。
李開復“安慰”記者說:“今天你跟我坐這采訪,機器完全可以做,你的問題基本上網上搜一搜,用深度學習挑一挑,都可以做出來的。但是你寫的文章,我覺得很多人工智能做不出來,因為你有很多自己的判斷分析,還有知道采訪誰,怎么把意見撮合起來。所以我覺得,做什么事情,一定要做得更深度,如果只是做這么一個采訪,肯定要被取代的。現在很多記者寫的文章,也是在網上攢出來的。這些攢文章的記者,他們就會被取代。”
微軟亞洲研究院常務專家芮勇早前也表示,要實現真正的人工智能還有很長的路要走,“假如讓阿爾法狗去下跳棋,它會完全傻掉。甚至說把圍棋的棋盤稍作修改,從19 19的格子變成21 21的格子,阿爾法狗都招架不住,但是人類就沒有問題。阿爾法狗可以打敗三十多歲的李世石,但它的學習能力不及一個5歲的小孩,這二者是有很大區別的,也是弱人工智能和強人工智能的區別。”
另外一個限制是人工限制都需要至少百萬級的數據量,才能獲得驚人成果,但是如果單獨拿出一個數據樣本出來,都是不可靠的,所犯的錯誤是人一輩子都不可能犯的。
比如說只打一手牌的話,冷撲大師和人類都有50%的機會能贏,對戰盤數越多,AI勝率才越高。又比如微軟曾經試著把一個人工智能放在Twitter上進行學習,幾個小時之后,它就變得充滿惡意,滿口臟話,帶有嚴重種族歧視。
馬云說,大家把阿爾法狗說得天花亂墜,很恐怖的樣子,但是他個人認為,機器是比人聰明,機器未來要做到人做不到的事情,而不是去模仿人類能做到的事情。
(審核編輯: 林靜)
分享