亚洲美女爱爱-夜夜添夜夜添夜夜摸夜夜摸-97碰成人国产免费公开视频-国产午夜大片-www黄av-国产94在线 | 亚洲-亚洲午夜久久久精品一区二区三剧-精品视频亚洲-久久久久国色av∨免费看-黄色片一区二区-69福利视频-国产老头和老头xxxxx免费-99精品视频一区在线观看-日韩三级黄色毛片-亚洲激情图片区-黄色a一级-99re6在线-91九色视频-日本欧美久久久-成人国产精品免费观看

你的位置:首頁 > 測試測量 > 正文

智能手機的超性能語音識別技術

發布時間:2011-12-20

中心議題:
  • 學習智能手機的超性能語音識別技術
  • 手機提供的羅盤或者GPS能夠增強自然語言處理的有用性
解決方案:
  • 在移動設備方面設計
  • 硬件和軟件技術

當語音識別技術應用到計算機桌面的時候,這看起來似乎是一個好主意。但是,對于大多數人來說,語音識別還不能取代鍵盤和鼠標。現在,語音技術正用于一個全新的環境:手機。語音識別技術在手機中的應用將進一步推動這種技術向新的方向發展和應用。這是語音識別技術在臺式電腦應用中從來沒有涉足的方向。

IBM今年將紀念其創建100周年。IBM在60年代初期創建了一個名為“Shoebox”的試驗性的語音識別系統。這個系統解決了口語算法問題。語音識別技術是在50年代作為一項早期的技術第一次出現的,當時主要是由于好奇。在60年代初,IBM的“Shoebox”設備能夠識別出16個口語單詞并且能夠回答簡單的數學問題,如“3 + 4 =?”。

Dragon Systems在80年代初為DOS計算機推出的DragonDictate可能是第一個語音識別應用程序。這個應用程序只能識別單個單詞,每次只說一個單詞。隨著時間的推移,這個應用程序已經發展成為名為“Dragon NaturallySpeaking”(目前是第11個版本,由Nuance通訊公司所有)的產品。這個應用程序能夠翻譯以正常的會話語音和速度讀出的文本。

語音識別技術在臺式電腦中的應用有兩個制約因素。第一,為了使這個應用程序以更高的準確性工作,這個應用程序必須要進行訓練以便識別用戶的語音特征。Windows Vista和Windows 7操作系統中的本地語音轉換文本技術和Dragon NaturallySpeaking等第三方產品仍然都需要一個用戶訓練期才能使用。

第二個制約因素是鍵盤的流行程度。大多數人已經習慣于鍵盤打字而不是講話,因此,語音控制面臨Dvorak鍵盤布局同樣的應用障礙。當簡單的老式QWERTY鍵盤供貨充足并且工作的很好的時候,為什么要學習使用Dvorak鍵盤呢?

微軟TellMe團隊是負責為多媒體環境開發語音識別技術的部門。TellMe團隊高級產品經理Abhi Rele指出,在臺式電腦環境,用戶有方便的人機交流模式,如鍵盤和鼠標。因此,語音的使用主要是針對語音愛好者的。

語音控制的計算更廣泛的應用需要兩件事情:更好的方便的應用和主要使用語音的地方。手機正是很長時間以來一直在增長的這種地方。

Nuance負責產品管理和營銷的副總裁Matt Revis解釋說,臺式電腦和移動環境的區別是這樣的:臺式電腦是一個固定的環境,重點完全在于臺式電腦的使用情況。因此,臺式電腦的語音技術主要執行如下任務:支持辦公應用程序、網絡瀏覽、通訊等。在移動方面,語音更多地用于支持各種生活方式方面:移動中的專業人員、戶外的有趣活動、免提電話等等。

Gartner分析師Tuong Nguyen贊同這個觀點:語音在移動環境中更有意義。他說,從使用的角度看,掌上設備的語音識別功能價值更大。它增加了用戶友好的、方便的輸入方式。

Nguyen補充說,如果不用語音技術說出一個簡單的說明語句,而是翻動許多菜單或者努力地在小顯示屏鍵盤上進行輸入,語音識別的價值就顯現出來了。隨著觸摸屏設備(沒有物理鍵盤)應用的增長,語音識別技術將用來增強數據輸入和輸出。語音識別還支持免提要求或者法律要求。
[page]
在移動設備方面


因為移動設備一般僅支持臺式電腦的一部分存儲和處理功能,語音處理需要一些時間才能以基本的形式出現在手機中。

語音處理Springer手冊解釋了手機在2000年代初的情況。盡管那時還有一些局限性,但是,手機經過編程之后能夠識別逐個數字的撥號語音,在某種程度上還能識別人的名字。主要問題是內存,因此,大多數手機一次只能識別10個數字或者名字。但是,這些作者指出的另一個問題是這個功能使用的比較少,可能是因為手機廠商在這方面的營銷很糟糕。

隨著手機的增加內存和增強處理能力,普通手機的識別能力也增強了。三星電子在2005年發布的售價99美元的SCH-p-207型手機增加了語音至文本的聽寫功能和語音撥號功能。隨著內存達到數百MB和存儲容量達到數GB,目前這一代智能手機很少受到限制。

另一個關鍵的進步是網絡速度。速度更快的無線網絡浪潮抬高了許多大船,包括最新一代的語音處理技術。速度更快的網絡能夠把語音處理任務從網絡遷移到遠程服務器。

谷歌語音搜索產品經理Amir Mane解釋了速度更快的網絡是如何幫助谷歌語音應用程序的。他說,由于所有繁重的處理任務都是由谷歌服務器在網絡上處理的,我們減少了掌上設備計算能力的限制。

目前的應用程序

手機語音識別技術目前的狀態不僅僅局限于語音撥號。語音啟動的功能實際上就包括語音撥號。這是手機上出現的第一個語音識別功能。目前,甚至許多低端手機都有這個功能,盡管這個功能處理手機電話簿中一些不常用的名字的時稍差一些。

Gartner分析師Nguyen指出,比較新的一代語音功能是更開放的。不用編程執行某些功能的具體的語音指令,應用程序可識別語音并且執行適當的行動。更高端的、更強大的設備使這些應用更可行。換句話說,不僅僅是能夠使用這個短語“呼叫888-555-1212”撥打一個電話號碼,用戶還可以說“呼叫媽媽”或者“給我媽媽打電話”。

谷歌語音搜索擁有比以前的語音識別技術更少的限制,因為所有的繁重任務都是由網絡服務器完成的。這使谷歌語音搜索等語音驅動的應用程序更可行。例如,如果你說“創戰紀電影時間”,你會看到一個網頁列出地區編號或者位置。這個應用程序不僅能夠識別出這個短語的意思,而且還能提供你的手機(你當前的位置)和網站(上映時間)的信息。

這個應用程序還非常熟悉英語,不用進行訓練就能自動分辨出一些詞匯的差別。如果我說“摩特里褲(Motley Crue)樂隊”,這個應用程序甚至能在搜索詞匯方便使用這個樂隊的獨特的拼寫,盡管它會漏掉變音符號。搜索“Motley''''s Crew”,你會得到一個喜劇片。

這就是說谷歌語音識別的限制明顯地表明將使你進一步脫離主流的英語。外國人的名字是沒有幫助的。語音識別應用程序的另一個問題是環境的噪音。移動用戶受環境噪音的影響通常比臺式電腦用戶多。Nuance公司的Revis稱,在充滿噪音的戶外環境中,語音識別的準確性是一個問題。

自從2005年三星的那款手機推出以來,聽寫功能已經取得了長足的進步。由Dragon NaturallySpeaking驅動的iPhone的Dragon聽寫功能允許用戶聽寫從備忘錄、電子郵件到Twitter更新等一切內容。用于電子郵件的Dragon軟件為黑莓設備提供了類似的功能。

對于Android手機來說,Nuance提供了FlexT9軟件。這個軟件把Dragon聽寫功能與三種類型的觸摸屏輸入方式結合在了一起。還有一個Handcent短信應用程序。這個應用程序集成了Android本地語音識別技術以幫助你用語音發短信。

文本之間的翻譯目前已經推出多年(如通過知名的Babel Fish網站進行翻譯)。同聲翻譯功能現在還沒有,不過,這種軟件很快會推出。例如,用于iPhone的Jibbigo軟件可翻譯單詞、短語和合理的簡單句子,讓雙方交替地講話。
[page]
未來的方向

詢問參加開發語音技術的每一個人下一個巨大的步驟是什么。他們一般會給你一個答案:自然語言處理。

Revis把它解釋為理解你的意思的系統,它不僅僅知道你說什么。在會話式的互動模式中,用戶說自己要說的話,沒有限制用戶如何說這個話。他提供了指令或者要求得到信息的例子,如“我在什么地方能夠買到100美元以下的尼康照相機?”或者“給杰尼發個短信說我晚到20分鐘”或者“今天晚上在Morton''''s訂三個人的地方”。

谷歌的Mane稱,在口語對話中提供自然的語言處理是一個雙重挑戰。首先,你必須識別這些單詞,然后,你必須理解這個意思。第一部分變得更加容易了。但是,第二部分仍然很難解決:意思是根據上下文確定的和難以應付的,人類做的語法分析也不是總是成功的。

微軟的Rele認為,手機提供的額外的服務(如羅盤或者GPS)能夠增強自然語言處理的有用性。他說,你可以為兩個人安排吃飯和看電影,方法是利用不同來源的數據把這個任務分開,如使用日歷、飯店排名、電影評論和位置等數據。

此外,手機的服務能夠用于提供講話的環境。Rele表示,用戶的語音輸入以及從其它有關用戶及用戶環境的傳感器和狀態獲得的智能信息可以提供更豐富的和更相關的結果。例如,如果你剛剛使用Foursquare網站查看有關飯店,一些含糊的語音指令就會傾向于外出吃飯、訂膳宿和要一輛出租車等事情。

多平臺應用程序Vlingo自稱是“虛擬助手”,已經能夠提供這些方面的功能。這個軟件插入到OpenTable和Fandango等服務中以完成許多任務:訂飯店、訂電影票等等。

Nguyen認為未來語音識別技術改善的另一個領域是游戲。他說,在游戲中可以使用語音以增加玩游戲的不同氛圍。例如,你可以把Kirk-style船長的命令傳遞給恒星飛船或者在在一個神秘的事情中審訊疑犯。
是你嗎?已經應用的另一個功能是自動地把語音識別適用于單個用戶。這是臺式電腦語音識別技術所要求的免提版語音訓練。

例如,最新版本的谷歌語音搜索有一個選擇性加入功能,允許隨著時間的推移建立一個用戶的客戶化語音特征。Mane解釋說,當用戶選擇使用客戶化語音識別的時候,我們在用戶和用戶的語調方面畫一個界限,這使我們能夠建立一個初步的、個性化的語音識別模式。

然而,個性化識別并不是一個能夠解決一切問題的技術,它只是實現語音識別更加無縫化的一個過渡步驟。Mane稱,我們沒有把個性化識別看作一個唯一的解決方案,因為還會有更多的一系列的技術創新。Mane認為,這種技術未來的改進需要我們的用戶更積極的參與。

結論

手機一直是許多技術的孵化器和推動因素,這包括硬件和軟件技術。到目前為止,在這個組合中增加語音功能僅產生了逐步的改善,谷歌語音應用程序的很好的功能。

但是,這些改進正逐步地為更重要的進步鋪平道路。移動技術為如何聚集這些新技術提供了一個全新的舞臺。下一步也許不是一個理解你說的一切事情的手機,而是能夠充分理解你說的事情的一個更有用的手機。
要采購鍵盤么,點這里了解一下價格!
特別推薦
技術文章更多>>
技術白皮書下載更多>>
熱門搜索

關閉

?

關閉

主站蜘蛛池模板: 高清国产天干天干天干不卡顿 | 嫩草av久久伊人妇女超级a | 久久中文精品无码中文字幕下载 | 免费看一级特黄a大片 | 激情综合区| 少妇又紧又色又爽又刺激视频 | av国产japan在线播放 | 国产后入清纯学生妹 | 国产欧美精品一区二区 | 国产激情久久久久久熟女老人av | 欧美日韩不卡视频 | 偷妻h高h短篇 | 日本高清免费在线视频 | 欲求不满的岳中文字幕 | 国产成人精品手机在线观看 | 亚洲天堂在线视频观看 | 国产精品992tv在线观看 | 午夜人妻久久久久久久久 | 国产91丝袜在线播放0 | 国产精品多人p群无码 | 久久精品视频免费 | 全肉乱妇杂乱视频在线观看 | 91九色在线播放 | 亚洲电影在线观看 | 中文无码人妻影音先锋 | 亚洲女子a中天字幕 | 亚洲精品美女在线观看播放 | 中出人妻中文字幕无码 | 日本韩国一级淫片a免费 | 乱人伦xxxx国语对白 | 亚洲处破女av一区二区中文 | 夜夜躁很很躁日日躁2020 | 有夫之妇3高潮中文字幕 | 一级特黄高清 | 国产a三级久久精品 | 欧美肥臀大乳一区二区免费视频 | 国产亚洲精品久久久久5区 国产91热爆ts人妖系列 | 亚洲色中色 | 99在线精品视频免费观看20 | 黄色大片免费观看视频 | 亚洲人成人影院在线观看 | a亚洲va欧美va国产综合 | 无码人妻精品一区二区三区不卡 | 日韩第八页 | 免费观看黄网站在线播放 | 特级毛片全部免费播放器 | 136av福利视频导航入口 | 成人a站 | 97超碰资源总站 | 亚洲乱码日产精品bd在线看 | 91精品国产影片一区二区三区 | 国产亚洲精品久久久久四川人 | 色狠狠av北条麻妃 | 国产精品国产三级国产有见不卡 | 亚洲欧美高清一区二区三区 | 九九99无码精品视频在线观看 | a级港片免费完整在线观看 久久久77 | 国产91精品高清一区二区三区 | 东日韩二三区 | 狠狠色丁香婷婷综合潮喷 | 四川丰满少妇毛片新婚之夜 | 国产精品一区二区av不卡 | 亚洲天堂五月天 | 日韩伦理大全 | 精品看片 | 午夜网址 | 色在线视频 | 国产一卡二卡3卡四卡无卡国色 | 国产精品久久人妻无码 | 欧美自拍亚洲综合丝袜 | 日韩一区二区三区在线 | 亚欧成人在线 | 欧美一级无毛 | 78m78成人免费网站 | 亚洲精品嫩草研究院久久 | 久久久久亚洲精品成人网 | 无码少妇一区二区性色av | 国产乱了真实在线观看 | 性色88av老女人视频 | 国产夜夜爽 | www.男女| 日本a在线 | 欧美巨大xxxx做受中文字幕 | 亚洲一区二区三区国产精品无码 | 国产精品美女久久久9999 | 国产在线播放av | 欧美日韩精品一区二区天天拍 | 性猛交波兰xxxxx | aaa少妇高潮大片免费看 | 亚洲电影区图片区小说区 | 国产成人亚洲综合无码18禁h | 国产99久9在线视频传媒 | 91tv亚洲精品香蕉国产一区 | av老司机在线播放 | 国产亚洲色欲色一色www | 精品一区二区国产在线观看 | 精品视频免费播放 | 极品美女一线天粉嫩 | 成人无码视频97免费 |