語音交互是智能手機等終端產(chǎn)品身上最便利的輸入工具,從2011年iPhone 4s首次集成siri至今,語音交互應用歷程僅僅走過三四年時間,但在這短暫的應用時間中,語音交互的價值和效應已經(jīng)得到凸顯。而隨著目前3G、4G網(wǎng)絡全面繁盛的狀態(tài),未來的語音交互將在生活、通訊、學習和工作中扮演更重要的角色。
1、手機語音交互:siri開創(chuàng)先河
2011年,蘋果公司發(fā)布新產(chǎn)品iPhone 4s,蘋果首席執(zhí)行官提姆.庫克在講述其新功能的時候,隆重介紹了其內置的一款叫做Siri的語音助理產(chǎn)品。之后,隨著iPhone 4s發(fā)貨量普及全球,這款有著中規(guī)中矩發(fā)聲的語音助理軟件也隨之走向世界。再這之后的數(shù)代蘋果產(chǎn)品中,蘋果公司都無一例外地內置了該款應用,并且使其通過語義學習而變得更加智能、便利和精確。
siri雖然只是一款普通的語音助理軟件,但其卻對后續(xù)的智能手機發(fā)展產(chǎn)生了重大的意義,這在它盛行后有大量的追隨者相繼涌現(xiàn)的現(xiàn)象便可一窺端倪。究其原因,是因為siri解放了用戶雙手,讓用戶在操控智能手機的時候有更多選擇,另外,siri的語音控制方式還能讓用戶在獲取查詢結果方面更便利。對于普通用戶,siri開創(chuàng)了一種新的交互方式。
但siri的天生自豪之外,卻是它的天生難堪——它成名于傲慢的蘋果世家。
蘋果公司擁有無與倫比的設計與產(chǎn)品體驗優(yōu)勢,能為全世界的用戶創(chuàng)造超越想像力之外的創(chuàng)新產(chǎn)品,但在siri身上,蘋果公司并未讓它的這些天賦在siri身上得到全面的綻放。因為,siri作為一款領先的智能語音交互工具,其誕生的早幾年只在英語市場有著強烈應用頻率,而在其他語種地區(qū),siri的表現(xiàn)就不再出眾。
siri這種顧此失彼的情況造就的結果,則使得大多非英語地區(qū)的市場迎來了全新的自我成長空間。在中國,科大訊飛旗下的訊飛語音、搜狗、百度等等公司在語音領域方面也下力兇猛,小米、魅族、中興等智能手機廠商也已經(jīng)全面融合和接入了語音助理需求等服務。中興手機剛剛推出的“星星2號”手機,是一款系統(tǒng)級、全嵌入式的穿透使用語音助理手機,其不僅識別率更高,響應速度更快,而且還融入了體感技術。
2、趨勢:語音交互融合智能終端
iPhone之后,其他手機廠商紛紛介入語音助理領域。
這種趨勢帶來的結果是多方面的。一方面,大家爭先恐后的涉足直接推動了語音交互的流行程度,但另一方面,不同廠家因為不同技術實力差異而導致的語音交互體驗差距,也讓不同消費者的感受是不一樣的。這其中的主要緣由,在于大多廠商都是在基于第三方語音識別的基礎上進行二次優(yōu)化或開發(fā),但大多開發(fā)者因為技術水平的不同,因此導致了最后真正做出有語音識別交互水準的往往都是大公司。
蘋果公司早在推出siri的前6年就開始籌備相關項目,而中國本土最富盛名的語音識別公司科大訊飛,其業(yè)務本身就是一家專業(yè)處理語音識別技術的公司。而百度、搜狗等公司在語音識別方面的優(yōu)勢則在于大數(shù)據(jù)——它們依賴搜索引擎進行海量的語料庫累積,這些語料庫被當作為語音識別的參考資料庫的情況下,其為用戶提供的語音識別功能也即有了無可比擬的優(yōu)勢。
這種優(yōu)勢體現(xiàn)在產(chǎn)品身上的直接結果,便是消費者可以直接享用到天然的技術積累優(yōu)勢,比如在中興最新的星星2號手機上,消費者可以通過語音控制完成拍照、應用開啟及駕駛模式下的導航與音樂等生活娛樂功能;在語音技術的基礎上,星星2號上還融入了體感技術,結合二者優(yōu)勢,讓語音操作在便捷的同時也更自然。另外,借助距離傳感器和光線傳感器,星星2號在點亮屏幕后無需解鎖和手動調出聯(lián)系人即可撥打電話。
諸如此類,這些依靠語音交互而實現(xiàn)體驗更加便利的方式,正是時下智能手機正在踐行著的事,而在其他終端領域,語音交互的應用實踐也在一步一步地顯現(xiàn)。
特斯拉廣為人知的緣由是其屬于電動車,但事實上,通過語音交互實現(xiàn)駕駛者更多需求的功能探索,目前也已經(jīng)成為包括特斯拉在內的大多汽車廠商在研發(fā)的焦點。對于在行駛途中有額外交互需求的駕駛者來說,語音交互是最為合適和恰當?shù)姆绞?。在其他領域如醫(yī)學、教育、精密儀器等等領域,語音交互的高效和便利一樣適用。
未來的語音交互不僅僅只局限于智能手機,汽車、家庭娛樂中心、政府部門或是其他相關機構,都能借助語音交互方式實現(xiàn)人力成本的減少但工作效率的提升。
3、4G潮流:智能手機提攜語音交互
語音交互在過去很長一段時間里并未受到重視,這是由當時的網(wǎng)絡狀況決定的,在過去的時代里,3G剛剛誕生、2G無力承擔一切的情況下,再優(yōu)秀的語音交互也無法施展全部風采。但在信息技術的浪潮下,4G時代的全面來臨,給予了語音交互巨大的成長空間。正是在這種3G鼎盛、4G繁盛、虛擬運營商也接踵而出的背景下,移動網(wǎng)絡的時代正全面到來。
智能手機上的語音交互應用可為用戶提供信息查詢、需求處理、生活服務處理等需求,因此基于高速的3G和4G網(wǎng)絡,語音交互可以無障礙地實現(xiàn)生活、工作和學習的更高效率化。這種狀況在過去需要依賴114等信息臺幫助完成的情況,在今天卻只需要消費者個人直接對智能手機說出需求即可。
當前的語音交互在使用與練習過程中,會通過不斷的自我學習達到新的理解程度。在現(xiàn)有的大數(shù)據(jù)、云計算和人工智能日趨取得突破的前提下,語音交互借助3G、4G高速移動網(wǎng)絡的時代已經(jīng)全面來臨。特別與智能手機形成相輔相成的方式,更讓語音交互在未來更加細致地融入每個人的生活與學習。
而目前隨著科大訊飛、中興等在語音交互方面的發(fā)力,未來不久遠的語音交互或許將邁上一個新的臺階。
4、語音交互挑戰(zhàn):急利于心or靜煉修成
語音交互作為最適合當前智能終端使用的輸入式方式,目前其作用已經(jīng)得到應證,未來隨著越來越多行業(yè)的加入和發(fā)展,其價值和商業(yè)效應還會得到更大的體現(xiàn)。在控制、傳達、理解與協(xié)調等日常程序中,語音交互的便捷、易傳達、高效、便利等特征將會帶來事半功倍的效果。特別對于無法打字或知識文化水平有限的用戶來說,語音交互的實質價值將影響更深遠。
不過,語音交互作為一項需要深厚技術積累、海量的語料庫積累而成的新型信息科學,需要以時間、優(yōu)秀的精準人才,以及強有力的技術及硬件作為支撐,在經(jīng)過周密而繁復的分析和計算之后,才能得到些許科學成果。這是一項枯燥且投入巨大的工作,沒有充足的回報誘惑,很難在短期內獲得成功。
正是在這樣的情況下,一些急功近利的機構或個人無法保持科研的初心,依靠各種取巧方式試圖走捷徑。這種方法雖然于情于理都不會被容許,特別對于科研精神和科研態(tài)度而言,這種走捷徑的方式雖然一直不恥于業(yè)界,但近年來仍有個別公司一直未放棄這種“努力”。
然而,所幸還有一些領先的語音交互研發(fā)公司保持了對技術的堅持,科大訊飛、中興、百度、騰訊等等公司在這方面都已取得不錯成績;而在成果轉化和落實方面,中興星星2號等一些革新二代語音交互手機產(chǎn)品的問世,也已經(jīng)為行業(yè)掀起
關于CNMO | 聯(lián)系我們 | 站點地圖 | 精英招聘 | CNMO記事 | 家長監(jiān)護工程 | 舉報不良信息
Copyright © 2007 -
北京沃德斯瑪特網(wǎng)絡科技有限責任公司.All rights reserved 發(fā)郵件給我們
京ICP證-070681號 京ICP備09081256號 京公網(wǎng)安備 11010502036320號