亞馬遜旗下的智能語音助手平臺Alexa及內置了Alexa的智能音箱產品Echo,可謂過去一年里智能家居市場當之無愧的明星。根據消費者智能研究機構 CIRP(Consumer Intelligence Research Partners)發布的報告,截止 2016年11月21日,Echo系列在美國的銷量已經達到510萬臺,實現了口碑、銷量雙豐收。在不久前舉辦的CES2017展會上,Alexa又狠狠賺足了眼球。亞馬遜本身雖未參展,但內置了Alexa語音助手的智能產品幾乎無處不在,其中包括LG推出的智能冰箱和家庭機器人Hub Robot。
盡管已經取得了諸多成就,亞馬遜并未在探索智能家居交互方式的道路上止步。上周四亞馬遜宣布, Alexa智能語音助手平臺已經擁有超過10000項“技能”(Skill)。而在一年前,這項數字才不過區區100多,Alexa的強化升級速度可謂驚人。如今,除了查詢天氣、播放音樂、創建任務、設置鬧鐘、發送消息之類的基本功能之外,Alexa還支持預訂外賣、Uber打車、控制家用電器等各種功能。
無獨有偶,亞馬遜宣布這一消息不久,谷歌便表示:從本周開始,Google助手將支持運行Android 7.0 Nougat和Android 6.0 Marshmallow的智能手機。作為亞馬遜最大的對手,谷歌在智能家居領域起步稍晚,2016年5月的I/O大會上與Echo對壘的Google Home才首度亮相。不過隨著Google Home學習Echo向第三方開發者開放后,谷歌加快了追趕的腳步。不久前有消息爆出,谷歌正在其智能手機Pixel中為智能語音程序“谷歌助手”Google Assistant添加新的功能,使得用戶可以通過Pixel用語音控制智能家居產品,就像使用谷歌智能音箱那樣。業界一直認為,擁有強大安卓生態的谷歌接下來會將Google Assistant適配更多的安卓手機,以快速攫取智能語音市場。僅僅一個多星期,這一猜想便得到了印證。
從谷歌和亞馬遜快速推進的步伐來看,智能語音助手前景無限,一個屬于智能語音交互的時代正在迅速開啟。然而,我們必須清醒地認識到智能語音交互技術仍然處在非常初級的階段。
首先,語音識別的準確率仍有待提升。去年,在錘子科技的M1手機發布會上,CEO羅永浩高調地演示了錘子手機內置的科大訊飛語音輸入法,并聲稱語音識別準確略高達97%。不過,根據筆者實測來看,識別準確率遠低于這一數值。這是因為語音識別技術對于環境的要求十分苛刻;背景噪音、口音、語速、特定領域的專有名詞等因素都會對識別準確率造成顯著的影響。因此,在當前技術水平下,語音識別技術的使用范圍仍十分局限,使用體驗也仍有改善空間。
其次,在正確識別用戶發音的前提下,機器是否真的能夠理解用戶想要表達的真實含義呢?眾所周知,人類口語跟書面語言有著巨大差異,與計算機可讀的二進制編碼或者字符序列更是天淵之別。把富有個性化的人類口語轉化成機器語言是一件十分浩大的工程,我們目前取得的成果尚十分有限。相信大家都對幾年前風行過一陣的手機語音助手還有印象,彼時不少人熱衷于“調戲”Siri等手機語音助手,但很快便感到興味索然。因為這些語音助手一問十不知,實在太笨了。毫無疑問,幾年過去,Siri們已經取得了巨大的進步,但只要它們的出錯率高于5%,對于用戶體驗的傷害便是無法挽回的。
當然,即便所有的技術現在已經足夠成熟,用戶們也沒做好接受它們的心理準備。沒有人愿意對著冰冷的機器說話,然后得到毫無感情的的回應。用戶希望從語音助手那里得到的,不僅僅是迅速準確的反饋,還有富有個性和感情聲音以及與人類交流時的親切感。
此外,人在與系統做交互的時候,能記住的信息只有10秒左右。舉一個常見的場景,撥打銀行的客服電話時,你必須集中精力聽語音播報,一旦被打斷就又得從頭聽一遍。這些都是我們在正式跨境語音交互時代的大門前必須面對和解決的問題。
不過,我們也不必為此感到灰心和喪氣,隨著技術的飛速發展,大多數問題在不遠的未來都將得到解決。屆時,語音交互或許不是能夠應對所有場景的唯一交互方式,但在腦波控制技術成熟之前,它必然是大多數場景下的最佳選擇。就目前而言,語音交互技術為我們提供了更多的選擇,而且在某些場景下,比如通過Echo智能音箱控制客廳的燈光,語音交互技術到來的用戶體驗已經大大優于手機APP和面板開關了。
我們有足夠的理由想象這樣一個場景:某個周日的早上,我們起床后,家里的智能音箱自動給我們播報當天的天氣狀況;冰箱里的牛奶只剩最后一盒時,語音助手會主動詢問是否需要添購;得到肯定答復后,語音助手已經安排快遞在約定好的時間送來,而你所要做的就是慢慢享用……
(審核編輯: 智匯小蟹)
分享