基于語音技術的人工智能聊天機器人“小冰”火了!在微博平臺上,“小冰”與無數“大V”聊天,并創(chuàng)下了72小時內1.3億人次的對話量。截至7月11日,“小冰”的微博粉絲數已超過77萬。曾有專家表示,智能語音五年火一次,經歷著“熱一陣、死一陣”的輪回,此番技術浪潮能否打破這個魔咒還需企業(yè)自己選擇,是打造無所不能的“變形金剛”,還是心無旁騖力爭在小范圍做精做細,不同的方向會帶來不同的命運。
國際巨頭搶灘市場
在開發(fā)者的構想中,蘋果的Siri應該是一個“任務引擎”,可以預測到用戶需要什么,并在用戶提出要求之前就打點好一切。但是它的使用率不夠理想,一項調查顯示,Siri推出兩年后,2330名iPhone用戶中僅有15.2%使用過Siri。
Google Now是谷歌在I/O開發(fā)者大會上隨安卓4.1系統同時推出的一款重量級應用。GoogleNow優(yōu)于Siri的一個先天優(yōu)勢在于與谷歌搜索功能的結合,用戶搜索的關鍵詞被記錄下來,GoogleNow智能化讀取關鍵詞后,為用戶提供相關的語音服務。此外,該應用的語音識別功能也得以加強,加上谷歌強大的“知識圖”,語音搜索結果非常準確?上У氖,GoogleNow只是作為Google Search的一個插件,僅將自然語義的語音搜索做到了應用里。
微軟宣布將在下一代移動操作系統中加入智能語音系統,取名Cortana(“小娜”)。這個號稱“全球首個真正的個人數字助理”擁有強大的學習和上下文聯想功能。“小娜”還能兼容第三方應用程序,極大地豐富了使用體驗。可見“小娜”的方向是朝著人工智能和移動端在布局。
IBM的聊天語音助手“Cognea”目前已經有4萬多用戶,這些用戶能在Cognea所提供的免費語音助手定制平臺上獲得專屬于自己的“語音機器人”。IBM目前正在努力將其開發(fā)的最新系統Watson打造成現實版的人機智能對話類電腦系統,以期擊垮“Siri姐”和“小娜妹”。
國內IT企業(yè)“不等閑”
目前,我國語音技術廠商基本分為三類:第一類是傳統語音技術廠商,一般從科研院所基礎研究脫胎,包括像科大訊飛(中國科技大學)、捷通華聲(清華大學、中科院聲學所、北京大學)等,其中訊飛語點是由科大訊飛推出的類Siri中文語音助手,目前已經推出Android、iOS版,并成功進入AppStore,和Siri展開正面競爭。
第二類是互聯網廠商,包括百度、騰訊等,他們?yōu)榻o其廣大的互聯網用戶提供更好的增值服務,普遍采用戰(zhàn)略合作或者收購等方式,掌握智能語音技術,推廣語音服務。其中,百度語音助手是一款支持語音指令、語音搜索、語音對話功能的智能語音服務軟件。
第三類是創(chuàng)業(yè)企業(yè),像云知聲、思必馳等,他們專注于某些行業(yè)領域,比如汽車、家電、教育、社交網絡來推廣自己的語音技術和產品。小i機器人公司一直以來長期專注于智能機器人技術的研發(fā)及產業(yè)應用。目前服務的用戶超過2億,每年有上百億次的對話互動。小i機器人廣泛應用于互聯網、運營商、金融、航空、汽車、電子政務等領域。
在糾結中發(fā)展
望洋興嘆:海量知識vs技術局限
在“語音識別”方面,目前智能語音軟件的表現都不俗,但“語義分析”則不同,它需要軟件開發(fā)者掌握大量語言數據;ヂ摼W中已經積累了大量的用戶產生的知識,主要存在于以下這幾類網站中:一是問答類網站,如百度知道;二是維基百科;三是書籍電影等開放評價網站,如豆瓣;四是美食評價網站,如大眾點評;五是商品評價信息,如淘寶網。由于智能語音應用尚未有能力整合這些互聯網的大量信息,無法提供全面的數據支持。此外,由于中文方言繁多,對口音甚至方言的識別,需要大量語料積累,非經濟實力和用戶基礎雄厚不能做到。
一廂情愿:產品vs用戶認可
經過短暫的嘗鮮階段后,這些智能語音應用似乎并沒有我們想象中的火爆。大多數用戶都把它們當成了玩具,試用幾次后就不再感興趣,究其原因,是這種新型的交互方式不能滿足人們的剛性生活需求。《2014第一季度中國手機輸入法市場季度監(jiān)測報告》顯示,在對手機輸入法用戶關于語音輸入調查中發(fā)現,語音輸入使用場景限制太多,語音輸入率在用戶中仍然不高,完全不使用以及幾乎不使用語音輸入的用戶合計占比達67.9%。
整個市場從熱度轉換為實實在在的“力量”還有些距離。業(yè)界談論更多的是如何提升技術、突破技術難度,而不是順應消費者需要,推出更多黏性強、服務能力強的應用和產品。今后的語音技術和產品,應該從技術導向向消費者導向轉移,企業(yè)應該推出更多消費者愿意用、發(fā)自內心喜歡用的語音產品和服務。
逆水行舟:投入vs產出
眾多競爭者的加入僅是一個開始,由Siri帶動的此輪“面向移動終端”的智能語音浪潮,盈利能力還有待觀察。從全球看,IBM、微軟、Nuance等跨國IT巨頭在語音識別技術上具有雄厚的綜合實力、技術基礎和行業(yè)經驗,但是他們語音產品的盈利模式也尚在探討之中。目前,憑借“只要占領市場,取得盈利指日可待”的信念激勵著開發(fā)者向智能語音市場不斷沖鋒陷陣,“不拋棄,不放棄”的代價是否能讓市場埋單,依然是個未知數。
盲人摸象:行業(yè)發(fā)展vs市場標準
這一輪的智能語音熱潮起于蘋果公司發(fā)布智能語音工具Siri,但其漢語服務推出相對滯后,給中國本土公司以成長機會。我國智能語音產業(yè)正在快速發(fā)展,2013年,全球智能語音產業(yè)規(guī)模達到30億美元以上,其中我國智能語音產業(yè)規(guī)模超過15億元。然而,目前智能語音市場上有些公司開發(fā)的軟件還是以國外產品的漢化為主,缺乏獨立的市場創(chuàng)新。政府應該積極推動建立市場標準,扶持產業(yè)發(fā)展。
* * *
智能語音不僅僅是一款語音助手的應用程序,與現實生活相結合,接地氣才能將其發(fā)揚光大。智能語音產業(yè)的特殊之處也就是在一定程度上依附于其他產業(yè)而存在,無論可穿戴、智能手表、智能家居、智能醫(yī)療和智能交通,未來每個領域都會進行數據開放,智能語音將引領產業(yè)重大變革。而智能語音的特點是大量的積累,這就決定智能語音產業(yè)是“一根針刺破天”的專業(yè)領域,而不是用一個鐵錘砸出一片聲勢的產業(yè),需要深耕久釀。