位于加州山景城的谷歌總部
據(jù)外媒報(bào)道,谷歌研發(fā)了一種“能學(xué)習(xí)所有任務(wù)的多功能模型”,在AI領(lǐng)域取得巨大進(jìn)步。
近日,谷歌低調(diào)發(fā)布了一份學(xué)術(shù)論文,在論文中描繪了機(jī)器學(xué)習(xí)的藍(lán)圖。谷歌研發(fā)新的機(jī)器學(xué)習(xí)系統(tǒng),它被稱為“能學(xué)習(xí)所有任務(wù)的多功能模型”,這一模型為以后的研究提供了一個(gè)模板,即如何創(chuàng)造一個(gè)能夠很好地處理多個(gè)任務(wù)的機(jī)器學(xué)習(xí)模型。
正如谷歌研究人員所稱的那樣,“多功能模型”接受了各種各樣的任務(wù)訓(xùn)練,包括翻譯、語(yǔ)言解析、語(yǔ)音識(shí)別、圖像識(shí)別和目標(biāo)檢測(cè)。雖然它的結(jié)果并沒(méi)有顯示出對(duì)現(xiàn)有方法的根本性改進(jìn),但至少表明,在不同的任務(wù)上訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng)有助于提高它的整體性能。
相比只是在單一運(yùn)算機(jī)器上進(jìn)行了訓(xùn)練,“多功能模型”在機(jī)器翻譯、語(yǔ)音和語(yǔ)法分析方面的準(zhǔn)確性都得到了提高。
谷歌的論文可以為未來(lái)機(jī)器學(xué)習(xí)系統(tǒng)的開(kāi)發(fā)提供一個(gè)案例,這些系統(tǒng)可以更廣泛地被應(yīng)用,而且也可能它比目前市場(chǎng)上大部分的狹義解決方案都要準(zhǔn)確。更重要的是,這些技術(shù)(或它們衍生的)可以幫助減少訓(xùn)練可行的機(jī)器學(xué)習(xí)算法所需的訓(xùn)練數(shù)據(jù)量。
該團(tuán)隊(duì)的研究結(jié)果表明,當(dāng)“多功能模型”接受了它所能完成的所有任務(wù)時(shí),它的準(zhǔn)確性就會(huì)隨著訓(xùn)練數(shù)據(jù)的減少而提高。這很重要,因?yàn)樵谀承╊I(lǐng)域很難積累足夠多的訓(xùn)練數(shù)據(jù)。
然而,谷歌并沒(méi)有宣稱擁有一種可以同時(shí)學(xué)習(xí)所有任務(wù)的算法。正如它的名字所暗示的那樣,“多功能模型”是為應(yīng)對(duì)不同挑戰(zhàn)而量身定制的系統(tǒng),以及幫助直接輸入這些專家算法的系統(tǒng)。這項(xiàng)研究的確表明,谷歌采取的方法可能對(duì)未來(lái)開(kāi)發(fā)不同領(lǐng)域的同類型系統(tǒng)有所幫助。
同樣值得注意的是,“多功能模型”還有大量的測(cè)試要做。谷歌的搜索結(jié)果還沒(méi)有被證實(shí),而且很難知道這項(xiàng)研究如何推廣到其他領(lǐng)域。谷歌的大腦團(tuán)隊(duì)已經(jīng)承諾開(kāi)放“多功能模型”的源代碼,讓更多的人去嘗試,但沒(méi)有給出具體的開(kāi)放。
對(duì)于“多功能模型”,谷歌也有一些明顯的改進(jìn)思路。谷歌團(tuán)隊(duì)指出,他們沒(méi)有花很多時(shí)間優(yōu)化系統(tǒng)的一些固定參數(shù)(在機(jī)器學(xué)習(xí)中被稱為“超參數(shù)”),而未來(lái)調(diào)參優(yōu)化將有助于提高準(zhǔn)確性。
(審核編輯: 林靜)
分享