巨頭較勁人工智能 語音識別成主戰場
- 時間:2017-07-13
- 來源:賽迪網
7月5日,阿里、百度兩大巨頭巧合地在同一天對外公布了自己的人工智能進展:智能語音音箱和無人駕駛。經過前期基礎和技術上的儲備與競爭之后,科技企業間人工智能競爭升級,開始了應用與產品上的競逐。
從人工智能的架構層級來看,這些年的發展已經逐漸向下端滲透。具體說,人工智能可分為基礎層、技術層和應用層,其中基礎層為算力支撐(AI芯片、云計算),技術層為算法平臺,應用層是AI向各傳統行業的滲透應用。通俗地理解,基礎層靠近“云”,應用層靠近“端”,是各種產品的落地。在之前不斷累積的大數據和算法優化過程后,當今正是各種場景之下的應用服務相繼爆發之時。
而單從最近兩巨頭的動作就可看出,語音識別已成為其中主戰場。也許這么說會覺得和無人駕駛相離太遠,但仔細分析,無人駕駛現在更重視用戶體驗和人機交互,多個概念車中都展示了語音控制汽車,可謂能動口絕不動手,用戶一聲令下就直接控制汽車行駛狀態,這其中對語音識別的需求也是不言而喻的。
其實這不僅是國內巨頭的目標,蘋果、谷歌、亞馬遜等國際巨頭甚至更早就開始推出各種智能語音產品,亞馬遜的Echo、蘋果的Siri和HomePod、谷歌的Google Home等一直不斷提升識別準確率和語音與其他場景的融合性。
各巨頭看準語音識別必將火熱、成為主戰場自有其理由。語音交互之所以越來越被重視,是因為互聯網、智能硬件的普及,改變了互聯網的入口方式,而語音就是最簡單的,最直接的交互方式,是通用的互聯網輸入模式。
從用戶角度來說,最簡單的控制就是“一聲令下”地簡單方式,無需任何操作讓機器讀懂人心。從商業場景來說,不論是娛樂、工作、家庭、出行、旅行等哪個場景,用戶都會隨時隨地需要語音控制,特別是不同場景下的語音信息代表不同需求,覆蓋全場景地語音接口搭載在各種智能硬件上,可以最大限度收集用戶需求,在深度挖掘后預判用戶未來需求,打通各個場景數據后可為各巨頭建立自身的生態鏈,讓更多場景的大數據反哺語音識別等人工智能技術的研發。
除了語音識別,AI在語音合成、對話管理,問答等方面也做了很多工作,還包括在不同端上的信號處理,例如麥克風陣列等等都是要去實踐的。這樣才能完成語音交互的完整過程。
語音識別技術的進展是有目共睹的,不過對此仍需保持冷靜,人機交互的自然性尚未達到和真人交流一般地靈活,機器人或智能硬件的“智商”也不能和真人相比。以私人助手為例,如果對面是一個真人管家,那么用戶一個表情也許管家就會讀懂需求,但對機器人來說,不僅需要用戶說出需求,而且用戶語氣和情緒的變化所代表的意義未必能全部捕捉,這時也許還需要用戶再次用語言說清需求,在用戶體驗上造成不便。
所以說,決勝人工智能或許是個偽命題,這些科技巨頭理論上應該比普羅大眾對人工智能的價值有更深刻的認識,他們也有充分可支配的資源進行研究和布局。互聯網時代、移動互聯網時代都是百花齊放各展所長,人工智能時代也是如此。