分享| Share!

08:35:40 / 2013年04月08日

#語音識別#技術能走多遠
從前,和電腦對話純粹是從科幻小說里跑出來面來的情節。如果你跟一臺電腦說:“開艙門?!?那肯定是在電影里。

而現在越來越多的人會同他們的智能手機對話,命令它們發送電子郵件,發短信,查詢路線以及在網上搜索信息。

“我們正處在一個過渡時期?!盢uance 通信的技術總監Vlad Sejnoha說:“在這個時期人聲和自然語言的識別是最前沿的技術,我相信語音識別技術將會大大地顛覆現在的電腦技術”Nuance通信的總部設在馬薩諸塞州的伯靈頓市。它以它的Dragon 軟件和其它產品占領了大部分的語音識別技術市場。

這項技術的進步一部分要歸功于幫助機器識別人聲的技術,包括機器學習和統計數據挖掘。復雜的語音技術已在各地的呼叫中心應用的相當普遍了。它能引導用戶使用菜單并識別那些已經發火的用戶,把他們交給真人客服代表。

當今的移動設備正日趨先進,使得智能語音控制越來越實用,越來越普遍。

麻省理工的資深研究員 Jim Glass 從二十世紀八十年代就開始研究智能語音。他說現在的智能手機可以做到90年代只有實驗室的機器才做得到的事情。 智能手機還可以同在云端的服務器進行高帶寬數據連接。服務器在那里完成它的重頭戲,處理語音識別以及辨識人聲提問等。Glass說:“ 更多的數據和更多樣的操作相結合能讓你做到之前無法做到的事情。你可以使用更加復雜的統計模式了?!?br/>
移動智能聲控最突出的例子當然就是Siri,即最新款iphone里的智能聲控助理。雖然語音功能在Windows Phone平臺,Android和其它一些移動系統以及很多應用軟件里也有,但這些技術仍有相當大的局限(見《社交智能》)。而我們正在一點點靠近可以真正進行人機對話的最終目標。

Nuance 在語音技術繁榮的過程中占有不可替代的地位。它建立于1992年,當時的公司名是Visioneer。 而后逐步收購了很多其它的語音技術公司?,F在它在世界各地35個地方和地區設有辦事處,員工人數也超過了6000人。 而它在2012年第二季度的財政收入是三億九千零三十萬美元,比去年同期增長了22.4%。

最近幾年,Nuance迅速地把他們在聲語音別方面的專長用在了語音智能的新興市場上。它為很多家公司提供語音識別技術,很多人都認為Siri的語音組件就他們提供的。

Nuance的技術總監說這項技術非常適合運用在移動計算上。其中一部分原因是用戶有時可能會騰不出手來,還有一個重要原因就是方便。只消說一聲,手機就能進行原本需要多次滑動和按鍵才能完成的操作。Sejnoha說:“突然你有了這個新的方法來解決問題。我相信我們會帶著這樣的想法進行基礎用戶交互設備的設計?!?br/>
語音識別軟件在手機上的成功給了Nuance相當的啟發,他們希望能把這項技術用在更多的地方特別是電視和汽車上。因為他們都很普遍且適合技術革新。

比如人們要在電視上找到一個節目或者錄制一段節目,就得根據蹩腳的菜單,使用遙控器一項項操作。而試圖讓操作變得更簡單的產品像是Google TV本身就太復雜而難以操作,根本不適合只想用輕松的娛樂節目打發一個晚上的觀眾們。

在Nuance實驗室的一個樣板客廳里,Sejnoha向同事們展示了DragonTV軟件在電視上的使用。一個同事說:“Dragon TV, 找找Meryl Streep的電影?!?軟件就會立刻搜索頻道找并出符合條件的電影?,F在這項技術已經使用在三星的某些電視機當中了。

曾一度有謠傳說蘋果將要研發自己的電視,并且有人大膽推測它將采用Siri的控制器。這個推測來自于Walter Isaacson為Steve Jobs撰寫的傳記,傳記里面這位蘋果的前任CEO曾宣稱已經解決了電視控制技術的問題。

同時,福特汽車已經將Nuance的技術使用在自己的Sync娛樂系統當中。它可以方便駕駛者自己查詢路線,調出天氣和歌曲。大概已經有四百萬已售出的福特汽車的Sync系統都有語音識別功能。上星期,Nuance推出了一種叫做Dragon Drive的軟件,這個軟件使其他汽車生產商也能享有語音控制功能。

這兩處新的技術應用都非常具有挑戰性。智能語音控制在智能手機上的普遍使用有一個重要原因,那就是用戶能夠直接對著設備的話筒講話。而在電視機旁或汽車里,通常有很多其它的噪音。為了能讓這項技術同樣應用在電視機和汽車上,公司正在進行排列話筒和排除干擾技術的實驗。

Nuance還生產了一種軟件開發包,可以讓任何用戶在任何設備上面實現語音識別功能。俄勒岡州阿什蘭的Montrue科技公司用Nuance的手機醫療軟件開發包研發出了一種適用于Ipad的應用程序。這種程序可以幫助醫生做口述錄音。、

Montrue科技的創始人兼CEO Brian Phelps 說“它非常精確。聲音轉了個彎,從機箱里精準的傳出”Phelps也是一為急診醫生。

同時,軟件開發包鞏固了Nuance的地位。通過發送更多的語音數據到服務器上,它幫助公司實現不斷更新和提高語音識別功能和語言處理運算技術。就像麻省理工的Glass說的一樣,在語音識別領域長期以來有一種說法,“數據永遠都不會嫌多?!?Nuance稱公司將數據保存在某個板塊里,以保證用戶的隱私安全。

Sjnoha相信,不久以后手機智能語音控制就會更加普及和先進。他說:“到那時我們根本不用碰到手機就可以發出指令。一旦機器聽到一些關鍵詞,比如打開日歷,準備發信息,查詢路線等,它就會立刻執行?!?br/>
人們甚至會同穿在身上的計算機講話。Google正在研發的眼鏡照相機就是很好的例子。Nuance說他們也正在為語音技術融入穿著而積極備戰。

*引自:http://www.techreviewchina.com/story/3744.htm
?

支持

ad ad ad ad

能為您做什么?

我們專注于 軟件開發,硬件集成,算法設計,逆向破解。全面為您提供策劃,架構,實施,測試,外包的貼心服務。

更多

我們的特點

自主JAVA框架、以及SGUI帶給您的項目更個性、更實用的用戶體驗。擁有各語言、平臺相關的開發經驗、技術文檔積淀,讓項目可維護性更高,更安全。

TAGS:成都軟件破解,成都APP破解,逆向破解,SGUI,GUI,外掛技術研究,程序破解,成都軟件開發,軟件開發,成都軟件外包,成都軟件定制,成都軟件公司,硬件集成,SUODR,C++,C,匯編,CPU指令,算法設計,C#,PHP,JAVASCRIPT,ACTIONSCRIPT,外包服務。


聯系方式

電話: (+86)028-86612252
               /15198199629
地址:成都市高新區益州大道中段722號復城國際T2棟1409號
EMAIL: yiqisun#suodr.com(#換成@)

QQ在線服務