近日,阿里云在2016年會上公開展示實時語音識別技術(shù),并現(xiàn)場挑戰(zhàn)世界速記大賽亞軍得主。據(jù)現(xiàn)場最終評測,機(jī)器人在準(zhǔn)確率上以0.67%的微弱優(yōu)勢戰(zhàn)勝第50屆國際速聯(lián)速記大賽全球速記亞軍姜毅。
阿里云年會現(xiàn)場,圖中左邊屏幕顯示的是語音識別,右邊屏幕顯示的是人工速記
從現(xiàn)場效果看,人工智能的穩(wěn)定性和并發(fā)計算能力是其優(yōu)勢。人類的體力是有極限的,尤其是在高強(qiáng)度壓力下,工作時間越長出錯概率越大,而機(jī)器則能自始至終保持同一水平。這一點(diǎn)在AlphaGo和李世石的圍棋比賽終中也反復(fù)得到驗證,在比賽中、后局機(jī)器的穩(wěn)定計算能力遠(yuǎn)超人類。
此外,人工智能的并發(fā)能力也非人工所能及。在發(fā)現(xiàn)錯別字后,機(jī)器可以瞬間修改所有錯誤,人工速記則需要在演講人短暫間歇的時刻返回修改,明顯表現(xiàn)得慌亂。
阿里云iDST語音組總監(jiān)鄢志杰表示,雖然已經(jīng)在接近世界一流的“速記師”的路上,但人工智能還有很長一段路要走?!霸谠肼?、口音以及對未見到過的數(shù)據(jù)的適應(yīng)性上,人類顯然更勝一籌?!?br/>
速記師姜毅則評價,雖然和人工智能比賽壓力很大,但“機(jī)器還是缺了一點(diǎn)點(diǎn)智慧”,并表示非常愿意收下這個“機(jī)器徒弟”,教會它更多的速記訣竅。
“看起來是機(jī)器挑戰(zhàn)人類,其實是人類在挑戰(zhàn)自己?!苯銖?qiáng)調(diào),“人工智能背后凝結(jié)的科學(xué)家智慧是人類的驕傲?!?br/>
第50屆國際速聯(lián)速記大賽于2015年在匈牙利布達(dá)佩斯舉辦,姜毅作為中國代表隊的九名選手之一,在文本看打速記比賽項目中以大約300字/分鐘的速度獲世界亞軍。
核心算法+GPU計算
所謂語音識別技術(shù),就是把語音轉(zhuǎn)換成文本,也稱為自動語音識別。語音識別是人工智能領(lǐng)域極為重要的前沿技術(shù)。在美國政府關(guān)于限制發(fā)放簽證的“Technology Alert List”中,語音識別赫然在列,與核武器、火箭技術(shù)等同在“黑名單”之中。
隨著自然人機(jī)交互需求的擴(kuò)大,個人智能助理漸漸成了各大巨頭爭奪的下一個入口,蘋果Siri等是個人智能助理類典型應(yīng)用。而語音識別則是人機(jī)交互的第一步。
據(jù)介紹,此次“人機(jī)大戰(zhàn)”的語音識別算法主要基于BLSTM(雙向長短時記憶神經(jīng)網(wǎng)絡(luò)),這種算法對單位時間內(nèi)的計算量要求很高,因此阿里云采用了帶GPU加速的新一代高性能計算平臺,單節(jié)點(diǎn)計算能力達(dá)16Tflops,并且對BLSTM算法做了針對性優(yōu)化,實時解碼更為順暢。
走出實驗室賦能應(yīng)用
阿里云iDST智能語音團(tuán)隊擁有世界一流的專家團(tuán)隊,此次年會展示的研發(fā)成果只是冰山一角。實際上語音技術(shù)已經(jīng)走出實驗室,在阿里內(nèi)部廣泛應(yīng)用,比如賦能阿里集團(tuán)客服和螞蟻金服客服團(tuán)隊的呼叫中心智能化。
去年雙11,螞蟻金服95%的遠(yuǎn)程客戶服務(wù)已經(jīng)由大數(shù)據(jù)智能機(jī)器人完成,同時實現(xiàn)了100%的自動語音識別。螞蟻金服客戶中心整體服務(wù)量超過500萬人次,客服人員的精力可以更好地集中到處理復(fù)雜類客戶問題和工作。
同時,語音團(tuán)隊還把智能語音交互技術(shù)賦能給YunOS以及手機(jī)淘寶、支付寶、釘釘?shù)纫苿佣藨?yīng)用。
(審核編輯: 智慧羽毛)
分享