人工智能領域的領軍人物,需過人工智能協會首位華人Fellow、第四范式首席科學家、香港科技大學計算機系主任楊強教授在論壇上提了這樣一個問題:“現在像Google這樣的公司是有人工智能的能力,一些大的銀行和機構也開始做人工智能,我們平頭老百姓什么時候也可以用起來人工智能呢?”
楊強表示:人工智能的范圍很大,問題比較局限,問題的邊界非常地清晰,比如說圍棋是一個問題,金融是另外一個問題,無人車是下一個問題,這個問題的定義越清晰它的成功概率就越低。
為此,他提出了人工智能要成功的5個條件。
人工智能成功的五要素
1、數據量需要有足夠的積累:
在2000年之后就有不同的網站開始收集人和人之間對弈的數據,經過10年的積累才收集了3000萬盤的數據,5年前這種數據很顯然是不夠的。因此,人工智能并不是說對任何問題都是迎刃而解的,馬上立竿見影的,而是需要有一定的數據積累的過程,也許我們今天看好的某個領域可能是醫療,也許從今天開始收數據,我們收獲碩果的時候是10年以后。
2、邊界清晰:
這也是DIGMIND這樣的公司首選做游戲的原因,在這個游戲之前做了很多單人的打飛船的游戲,這些游戲都可以從數學上來定義動作。
3、外部反饋:
楊強表示:這個反饋就等于是老師在教我們,如果沒有這些老師我們是不是可以學出來?現在有一些學者在研究非接入學習,這是不是可以成功?非常少。我們在諾亞方舟實驗室的時候和吳文達的研究小組有一個溝通,他們非常希望在華為得到一些訓練數據大家一起合作做一些語音方面的工作,他們的第一個問題是你的數據有沒有標注,如果沒有標注就完全不感興趣,所以外部的反饋是非常非常重要的。
4、龐大的計算資源:
楊強舉例了AlphaGo所需要的計算資源:如果說李世石一天吃一個漢堡包,AlphaGo需要吃300個,換算成硬件來說就是大概用了300個CPU,普通大學的實驗室有6個CPU已經非常不錯了,這樣一個“土豪型”的實驗室的量是必不可少的。之后是頂級的數據科學家了。
5、深度學習
這五個條件實際上都是門檻,就是說一般的老百姓、一般的公司甚至是大公司沒有人工智能積累的公司,如果要進入人工智能取得這樣的成功是不可能的。
人工智能的發展方向
未來的人工智能方向是怎樣的?楊強表示可以從亮點去看:
1、“強化學習”
首先我們要知道延遲反饋這一概念,舉個例子只能在一個學期到學期尾才知道我們期末模式考得好考得壞;在投資股票、在理財產品,過幾天才知道這個投資是對還是錯,這種現象被稱為延遲反饋。
得到延遲反饋的時候中間已經有了很多的步驟,我們不清楚哪個步驟是使得我們得到反饋的,因此我們要用到強化學習。
楊強:“說起強化學習我不得不提到Google去年在自然雜志上發表的一篇文章,橫向是得到的分數,每一個欄是個人的游戲,這個是個人學習的系統,每一次打游戲學會,再一次再打輸再學會是自學習的過程,中間的這條線是humanlevel,去年5月份已經有一大半超過人類的水平,現在是所有的都超過人類的水平了,而且完全是自學習的,我們在實驗室里面也實現了打乒乓的游戲,我們發現拿一個單一的GPU來算花了三天三夜的時間不斷地打乒乓,最后可以達到日類的最高水平。”
所以說強化學習是一個在狀態空間的搜索,在過去人工智能的研究中,錯誤地認為一些狀態應該是由人來定義的,因此它就一直是止步不前,甚至是有幾十年的功夫都沒有很大的突破,最近兩年通過Google和其他的研究者的研究,發現這些狀態原來可以通過深度學習來定義,那么有了深度學習以后,強化學習里面的難題也就迎刃而解了,我們現在不在乎來定義這些狀態我只需要來定義輸入和輸出,這個有一個特別的名詞叫端到端的學習,也就是說我們只關心它的輸入,比如說Google打游戲的只關心一個屏幕的截圖作為輸入,它的輸出就是贏了為贏,就這么簡單叫做端到端的學習。
2、遷移學習
遷移學習里是分兩個領域的,假設我們有一個領域已經做得很好了,比如說我們學會了法語,那么我們再學一個新的語言如果說學英語的時候,我們會或多或少地利用法語,因為它們都是拉丁系。
假設現在我們有很多的穿戴式設備,比如說手表,我們希望通過穿戴式數據來知道這個人做什么,比如說是在開車、跑步還是在睡覺還是在聽講,但這樣標注數據是非常少的,怎么辦呢?我們可以到虛擬世界找更多的數據,比如說微博和微信,我們發現里面有很多大家談論的行為的數據和地點的數據,我們把這兩個數據加關聯,我們有大量的虛擬世界的模型遷移到現實世界,我們就可以有更好的模型來告訴我們這個人到底在做什么,可以幫助穿戴式的硬件公司做一個行為模型。
強化學習加上遷移學習,實際上還可以做另外一件事,除了能夠把小數據也用起來,還可以實現個性化。
總結一下,我們按照現在的方式走下去只是AIFORSOMEONE,我們希望能夠達到AIFOREVERYONE,因此我們能夠個性化的情況下,讓中小公司和非人工智能的公司用起來的話,一定要在技術上努力,包括我們現在推的“先知”平臺,包括我們用的遷移學習。
(審核編輯: 智匯小蟹)
分享