在過去幾年,人工智能和機器學習頻繁出現在技術新聞和各種網站上。兩者常常被用作同義詞,但許多專家認為它們存在微妙且重大的區別。
當然,專家們自己有時對于那些區別到底是什么也意見不一。
然而一般來說,有兩點似乎很清楚:第一,人工智能(AI)這個術語的歷史比機器學習(ML)更早;第二,大多數人認為機器學習是人工智能的一個子集。
最能清楚表示這種關系的圖形之一來自英偉達公司的官方博客。它提供了一個很好的起點,有助于了解人工智能和機器學習之間的區別。
人工智能VS機器學習――首先,什么是人工智能?
計算機科學家對人工智能有諸多不同的定義,但究其核心,人工智能包括像人類那樣來思考的機器。當然,很難確定機器是不是在“思考”。因此實際上,建造人工智能需要建造擅長處理人類擅長的那類工作的計算機系統。
創造像人類一樣聰明的機器這個想法可以一直追溯到古希臘人,當時流傳神創造自動機方面的神話。然而實際上,這個想法直到1950年才真正流行起來。
就在那一年,阿蘭·圖靈(Alan Turing)發表了一篇開創性的論文,題為《計算機器和智能》,提出了機器會不會思考的問題。他提出了著名的圖靈測試,該測試實際上聲稱:如果人類無法判斷自己在與人類交互還是在與機器交互,就可以說該機器是智能機器。
人工智能這個詞語于1956年由約翰·麥卡錫(John McCarthy)創造,他在達特茅斯組織了一次學術會議,專門討論這個話題。會議結束后,與會者建議進一步研究“這個推測結果,即學習的每個方面或智能的其他任何特征原則上可以非常精確地加以描述,那樣就可以研制出模擬它的機器。將旨在搞清楚如何使機器使用語言、形式抽象和概念,解決現在留給人類去解決的問題,并改善自身。”
這個提議預示了當今人工智能領域備受關注的許多話題,包括自然語言處理、圖像識別及分類以及機器學習。
在那第一次會議后的幾年里,人工智能研究蓬勃發展起來。然而在幾十年內,這一點卻很顯然:建造真正認為具有獨立思考能力的機器的技術多年后才會問世。
但在過去十年,人工智能已從科幻小說領域進入到科學事實領域。新聞媒體長篇累牘地報道IBM的Watson人工智能技術贏得智力競賽電視節目《危險邊緣》和谷歌的人工智能技術在圍棋比賽中擊敗人類冠軍,這讓人工智能重返公眾視野。
如今,所有最大的技術公司都致力于人工智能項目,我們大多數人每天在接觸人工智能軟件,比如使用智能手機、社交媒體、互聯網搜索引擎或電子商務網站。我們最常接觸的其中一種類型的人工智能就是機器學習。
人工智能VS機器學習――好吧,那么機器學習又是什么?
“機器學習”這個短語同樣可以追溯到上世紀中葉。1959年,阿瑟·塞繆爾(Arthur Samuel)將機器學習定義為“不需要明確編程就能學習的能力。”為此,他開發了一個計算機檢查程序,這是能從自己的錯誤中學習,不斷改善性能的早期程序之一。
與人工智能研究一樣,機器學習長時間不流行,但是當數據挖掘這個概念在上世紀90年代開始大行其道時,它再度流行起來。數據挖掘是使用算法來尋找某一組信息中的模式。機器學習則做的是同樣的事情,但更進了一步――它可根據學到的知識來改變程序的行為。
近來變得非常流行的機器學習的一個應用是圖像識別。這類應用軟件首先要加以訓練――換句話說,人類要看一堆圖片,告訴系統圖片中有什么。成千上萬次重復后,軟件明白像素的哪些模式通常與馬、狗、貓、花、樹、房子等有關,然后可以非常準確地猜中圖片內容。
許多基于互聯網的公司也使用機器學習來驅動他們的推薦引擎。比如,當Facebook決定在你的新聞源中顯示什么內容,亞馬遜重點推介你可能想要購買的產品,Netflix推薦你可能想要觀看的電影時,所有這些建議都是基于預測,而這些預測源自現有數據中的模式。
目前,許多企業開始使用機器學習功能用于預測分析。由于大數據分析變得更流行,機器學習技術變得更常見,它已是許多分析工具的一項標準功能。
事實上,機器學習已經與統計、數據挖掘和預測分析緊密相關,以至于一些人認為,應將機器學習歸入與人工智能不同的領域。畢竟,系統不必擁有任何機器學習功能,就能展示人工智能特點,比如自然語言處理或自動推理,機器學習系統沒必要擁有人工智能的其他任何特點。
其他人更喜歡使用“機器學習”這個術語,因為他們認為,這聽起來比“人工智能”更含有技術味,少一點可怕。一位互聯網評論人士甚至表示,兩者的區別是“機器學習是切實在工作。”
然而從一開始,機器學習就是人工智能方面討論的一部分,兩者在如今進入市場的許多應用中仍密不可分。比如,個人助理和機器人程序常常有許多不同的人工智能特點,包括機器學習。
人工智能和機器學習的前沿:深度學習、神經網絡和認知計算
當然,“機器學習”和“人工智能”不是與這個計算機科學領域有關的唯一兩個術語。IBM經常使用“認知計算”這個術語,它或多或少是人工智能的同義詞。
然而,其他一些術語確實有非常獨特的含義。比如,人工神經網絡或神經網絡是這樣一種系統:旨在以類似生物大腦工作機理的方式來處理信息。情況可能會變得令人困惑,因為神經網絡往往特別擅長機器學習,所以那兩個術語有時被混淆。
此外,神經網絡為深度學習提供了基礎,深度學習是一種特殊的機器學習。深度學習使用在多層次運行的某一套機器學習算法。這一方面有賴于使用GPU同時處理一大批數據的系統。
如果你對所有這些不同的術語覺得困惑,并非只有你才這樣。計算機科學家繼續在爭論它們的確切定義,這種爭論可能會在未來一段時間內持續下去。由于許多公司繼續往人工智能和機器學習研究投入資金,到時可能會出現更多的術語,給這方面的問題進一步添加了復雜性。
(審核編輯: 林靜)
分享