提及人工智能(AI),恐怕大多數(shù)人首先想到的仍是多年前,斯皮爾伯格執(zhí)導(dǎo)的那部電影。實(shí)際上,很長一段時間,人們對AI的研究尚且停留在文字層面,且計(jì)算機(jī)對普片的識別,要依靠人工添加的標(biāo)簽與注釋?,F(xiàn)在,這一窘境終于有望被打破。
文字層面尚淺 盤點(diǎn)五類可識別圖片AI技術(shù)
今年5月份,谷歌推出了Google Photos,谷歌聲稱搜尋特定某人,你會找到對方從現(xiàn)在到嬰兒時期的照片;搜索品種名,則能找到相應(yīng)品種狗的照片。把名字和食品類別結(jié)合起來,比如輸入‘最大披薩’,就能鎖定特定圖片。
之后,谷歌以TensorFlow平臺形式開源了它的人工智能主體部分。盡管TensorFlow并不是第一個開源人工智能平臺,但它卻是與谷歌強(qiáng)大圖片搜索關(guān)系最為密切一個。
同樣在今年,一家名為CamFind的圖片識別和視覺搜索公司,推出了一款“云視覺”(CloudSight)公共應(yīng)用平臺。該API支持開發(fā)者通過CamFind的人工智能,進(jìn)行圖片內(nèi)容分析。
這樣,可使大多數(shù)情況下掃描具有高度特定性,例如識別汽車的制造與模型,寵物狗的品種以及食品的具體類型。一旦分析出圖片中的物品,開發(fā)者便可通過這些信息來獲取網(wǎng)絡(luò)上的文字信息。
目前,F(xiàn)acebook已開始在Messenger應(yīng)用上測試一項(xiàng)新功能“Facebook Photo Magic”,該應(yīng)用會掃描手機(jī)相冊照片,并對照片進(jìn)行面部識別處理?!癙hoto Magic”會識別照片中的人物并建議你和他們一起分享這些照片。Facebook使用人工智能對面部和名字進(jìn)行匹配,人工智能掌握的照片越多其識別效果越佳,即便臉部被遮住,F(xiàn)acebook的“面部識別”一樣能夠識別出你的臉部。
當(dāng)然,除了面部特征該系統(tǒng)還關(guān)注發(fā)型、姿勢、衣著和身材。此外,Photo Magic拓展了圖片庫來源。也就是說,它除了收集Facebook外,還可以收集Messenger(聊天應(yīng)用)的數(shù)據(jù),擴(kuò)充數(shù)據(jù)量。
近日,微軟也更新了自己的牛津項(xiàng)目(Project Oxford)。實(shí)際上,Project Oxford是一個讓開發(fā)者通過旗下的Azure云平臺,使用微軟人工智能系統(tǒng)的工具包。
據(jù)了解,Project Oxford工具包能夠支持包括口語、視頻以及其他媒體在內(nèi)的人工智能應(yīng)用。但與這些相比,其最強(qiáng)大的功能要屬牛津項(xiàng)目現(xiàn)在支持開發(fā)者通過牛津人臉應(yīng)用平臺接口項(xiàng)目( Project Oxford Face API),檢測照片中的人物表情。
例如用Project Oxford處理上圖的五個人組成照片,Project Oxford可以識別照片中的人臉以及每個人的表情,或快樂或憤怒或者焦慮等等。不得不說,該項(xiàng)功能創(chuàng)造了一個全新的高度,讓人工智能像人類一樣“解讀”圖片。
巧合的是,Pinterest也在近期發(fā)部了自己全新的圖片搜索功能“Visual Search”,幫助用戶發(fā)現(xiàn)更多的信息,甚至幫助他們購買在固定照片中找到的產(chǎn)品。該功能以伯克利視覺和學(xué)習(xí)中心的深度學(xué)習(xí)人工智能為基礎(chǔ)。
用戶在Pinterest頁面看中的圖片中,來回拖動一個盒狀標(biāo)識以選中自己心儀的物體。隨后,搜索工具會找到具有相似圖案與顏色的類似產(chǎn)品,系統(tǒng)將最匹配的結(jié)果鏈接到購買按鈕上,點(diǎn)擊這里就能購買該產(chǎn)品。這點(diǎn)倒是與淘寶中的“查找相似款”有些類似,只不過Pinterest是通過圖片。
最后,再來說說Deepomatic。Deepomatic網(wǎng)站開發(fā)了一個服務(wù)型的智能搜索引擎,可以識別圖片中的各類商品數(shù)據(jù)。Deepomatic不僅可以為用戶找到相匹配的顏色、圖案以及其它數(shù)據(jù),還能識別出圖片中的物品,將該物品與一個全面的時尚產(chǎn)品數(shù)據(jù)庫進(jìn)行匹配。
對此,Deepomatic網(wǎng)站表示,該技術(shù)是模擬了人類大腦接收視覺信息的方式,并將這種方式用來理解各種概念。
實(shí)際上,這僅僅是人工智能從文字層面邁向圖片識別的一個開始。通過API,開源程序以及服務(wù)化處理讓人工智能識別圖片能夠成為實(shí)現(xiàn)。要知道,若想真正做到模擬人類,人工智能即計(jì)算機(jī)必須擁有自己的視覺。
(審核編輯: 智慧羽毛)
分享