亚洲美女爱爱-夜夜添夜夜添夜夜摸夜夜摸-97碰成人国产免费公开视频-国产午夜大片-www黄av-国产94在线 | 亚洲-亚洲午夜久久久精品一区二区三剧-精品视频亚洲-久久久久国色av∨免费看-黄色片一区二区-69福利视频-国产老头和老头xxxxx免费-99精品视频一区在线观看-日韩三级黄色毛片-亚洲激情图片区-黄色a一级-99re6在线-91九色视频-日本欧美久久久-成人国产精品免费观看

你的位置:首頁 > 傳感技術 > 正文

識別音頻和語音信源,利用MEMS麥克風定位就可搞定!

發(fā)布時間:2015-05-13 責任編輯:echolady

【導讀】本文主要介紹MEMS麥克風陣列所需的硬件架構,利用MEMS麥克風陣列定位并識別音頻和語音信源。自從微機電系統(tǒng)的麥克風陣列的出世,麥克風音頻定位就引起各界關注。

目前業(yè)界正在使用MEMS麥克風陣列子系統(tǒng)開發(fā)嵌入式音頻定位、自動語音識別和自動說話人識別解決方案,聲音識別定位是我們識別確認他人身份的基本功能,當我們聽到有人講話時,會將頭轉(zhuǎn)向說話人,查看說話人。

音源定位是自動語音識別和自動說話人識別系統(tǒng)的一個重要環(huán)節(jié),對于提高語音識別系統(tǒng)的性能至關重要。麥克風陣列可捕捉從不同方向傳來的聲音,通過算法運算使麥克風指向某一個特定方向,放大從該方向捕捉到的音頻信號,同時衰減從其它方向捕捉的音頻信號,整個動作就像一個智能麥克風。

識別音頻和語音信源,利用MEMS麥克風定位
圖1:綜合利用麥克風音源互相關性(CC)、相變(PHAT)和最大相似性處理(ML)技術的音源定位

系統(tǒng)框架

整個系統(tǒng)由以下幾個子系統(tǒng)組成:音源方向測定、數(shù)據(jù)融合、自動語音識別和自動說話人確認。其中,音頻方向測定子系統(tǒng)基于麥克風陣列,運行三個不同的音頻方向估算算法;數(shù)據(jù)融合子系統(tǒng)負責推斷方向,自動語音識別子系統(tǒng)利用傳入的音頻信號增強主音源信號強度,衰減主音源周圍的其它音頻信號。最后,自動說話人確認子系統(tǒng)識別某些關鍵詞匯,再利用相關特征與說話人匹配。

識別音頻和語音信源,利用MEMS麥克風定位
圖2.系統(tǒng)框架(注:Secondary speaker:副揚聲器;primary speaker:主揚聲器;mic array:麥克風陣列;data fusion:數(shù)據(jù)融合)

如果語音識別任務沒有成功,則反饋給數(shù)據(jù)融合系統(tǒng),估算新方向傳入的語音,然后驅(qū)動麥克風陣列指向該方向。
[page]
語音識別和說話人識別

語音特征提取(27 LPC-倒普系數(shù))需要確定語音的端點,將語音分成數(shù)個短禎(每禎20 ms),通過一個DTW模式對準算法與一組參考語音(模板)匹配。然后,應用歐氏距離測量法進行相似性評估。

識別音頻和語音信源,利用MEMS麥克風定位
圖3. 特征提取、模式匹配和評分是說話人語音識別確認任務的主要環(huán)節(jié)

說話人身份評分采用的是動態(tài)時間規(guī)整近鄰(DTW-KNN)算法的距離測量方法,即動態(tài)時間規(guī)整測量算法與近鄰決策算法的合并算法。這個算法需要使用均方根、過零率、自動相關和倒普線性預測系數(shù)。使用歐氏距離算法計算成本函數(shù),使用KNN 算法計算最小距離匹配度 k。

MEMS麥克風陣列

我們采用STM32F4微控制器和MEMS麥克風開發(fā)一個硬件音頻信號同步采集處理子系統(tǒng),其信號捕捉能力相當于8個采樣率高達48 KHz的麥克風 。

識別音頻和語音信源,利用MEMS麥克風定位
圖4.采用STM32F4微控制器和MEMS麥克風的硬件音頻信號同步采集處理子系統(tǒng)

MEMS技術

MEMS技術的主要特性是在能夠同一芯片表面集成微電子和微機械單元,在同一封裝內(nèi)整合不同的功能。這樣,過去分別由傳感器、執(zhí)行器(例如,射流管理或機械交互)和邏輯、控制單元完成的不同功能,今天可以整合在同一個封裝內(nèi)。從生化分析,到慣性系統(tǒng),從機械傳感器,到音頻和聲波傳感器, MEMS產(chǎn)品覆蓋很多應用領域。

MEMS麥克風和音頻編碼

MEMS麥克風尺寸雖然比其它技術麥克風小,但是,從物理和機械角度看,卻具備標準駐極體麥克風的全部功能,其核心部件是一個振膜,振膜和固定框架共同組成一個可變電容器。當聲波引起振膜變形時,電容會發(fā)生變化,從而導致電壓變化。

被捕捉到的信號的后期處理,即功率放大和模數(shù)轉(zhuǎn)換過程,都是在同一芯片上完成,因此,麥克風輸出是高頻PDM信號。在脈沖密度調(diào)制過程,邏輯1對應一個正 (+A)脈沖,而邏輯0對應一個負(-A)脈沖。因此,假設輸入一個周期的正弦音頻,當輸入電壓在最大正振幅時,輸出為一個由“1”組成的脈沖序列;當輸入電壓在最大負振幅時,輸出則是一個由“0”組成的序列。當穿過0振幅時,聲波在1和0序列之間快速變化。如果方法正確,PDM可通過數(shù)字方法給高品質(zhì)音頻編碼,而且實現(xiàn)方法簡易,成本低廉。因此,PDM比特流是MEMS麥克風常用的數(shù)據(jù)輸出格式。

另一方面,PCM是一個非常著名的音頻編碼標準,以相同的間隔對信號振幅定期采樣,在數(shù)字步進范圍內(nèi),每個采樣被量化至最接近值。決定比特流是否忠實原模擬信號的是PCM比特流的兩個基本屬性:采樣率,即每秒采樣次數(shù);位寬,即每個采樣包含的二進制數(shù)個數(shù);通過降低采樣率(降低十分之一)和提高字長,可以將PDM編碼信號轉(zhuǎn)成PCM信號,PDM數(shù)據(jù)速率與降低十分之一的PCM采樣率的比值被稱為降采樣率。因此,對于N:1降采樣率,只要每N個間隔采樣一次(不考慮剩余的N-1),即可完成降低十分之一的采樣過程。

麥克風陣列

從硬件角度看,這款產(chǎn)品基于STM32F407VGT6高性能微控制器,能夠通過8個MEMS麥克風采集信號。STM32F4微控制器基于工作頻率最高168 MHz的高性能ARM Cortex-M4 32 RISC處理器內(nèi)核,集成高速嵌入式存儲器(閃存容量最高1 MB, SRAM容量最高192KB)以及標準和先進的通信接口,例如,I2S全雙工接口、SPI、 USB FS/HS和以太網(wǎng)。
麥克風陣列通過RJ45以太風接口或USB OTG FS接口連接其它器件,與其它器件交互是通過可控制基本板設置的DIP開關實現(xiàn)。

如下圖所示,每個MEMS麥克風都是由同一個時鐘源觸發(fā),時鐘源由專用振蕩器驅(qū)動,對每個GPIO端口的一個引腳輸出1位PDM 高頻信號。輸出PDM數(shù)據(jù)頻率與輸入時鐘同步,因此,DMA控制器以同一頻率即音頻捕捉頻率對GPIO端口進行讀操作,然后將1 ms音頻數(shù)據(jù)(每次)保存在存儲器緩沖電路。這時,該緩沖器包含麥克風交叉信號,然后軟件利用優(yōu)化的快速解碼函數(shù)對數(shù)據(jù)進行解復用處理。最后,PDM 數(shù)據(jù)通過數(shù)字信號處理環(huán)節(jié),再進行PDM轉(zhuǎn)PCM處理。

識別音頻和語音信源,利用MEMS麥克風定位
圖5.每個MEMS麥克風都是由同一個時鐘源觸發(fā),時鐘源由專用振蕩器驅(qū)動,對每個GPIO端口的一個引腳輸出1位PDM高頻信號

麥克風傳來的PDM信號經(jīng)過過濾和十分之一降采樣率處理,以取得所需頻率和分辨率的信號。麥克風輸出的PDM數(shù)據(jù)頻率(麥克風的輸入時鐘)必須是系統(tǒng)最終音頻輸出的倍數(shù),濾波器管道輸出是一個16位值,我們將 [-32768, 32767]視為一個單位增益(0 dB)的輸出范圍。

原先濾波管道產(chǎn)生的數(shù)字音頻信號在信號調(diào)理前被進一步處理。管道第一級是一個高通濾波器,主要用于除掉信號DC失調(diào)。為保護信號質(zhì)量,該濾波級是使用一個截止頻率不在可聽頻率范圍內(nèi)的 IIR濾波器,管道第二級是一個基于IIR濾波器的低通濾波器。兩個濾波器有啟用和禁用以及配置功能;可通過外部整數(shù)變量控制增益。

識別音頻和語音信源,利用MEMS麥克風定位
圖6.麥克風傳來的 PDM信號經(jīng)過過濾和十分之一降采樣率處理,以取得所需頻率和分辨率的信號

如上文所述,數(shù)據(jù)采集有兩個比特流解決方案,通過DP開關選擇用哪一個方案。當選用 USB且在主機USB插入麥克風陣列時,主機將STM32_MEMS_Microphones視為一個標準的USB音頻設備。因此,主機系統(tǒng)無需安裝驅(qū)動軟件。例如, STM32_MEMS_Microphones可直接連接第三方PC音頻采集軟件。當選用以太網(wǎng)時,STM32_MEMS_Microphones發(fā)送RTP數(shù)據(jù)包。在網(wǎng)絡服務器的以太網(wǎng)設置頁對目的地IP、設備單播地址和采集參數(shù)進行配置。

結(jié)語

音源定位識別是語音識別技術中的一個重要的語音預處理環(huán)節(jié),對提高音頻應用和聲控應用性能具有重要意義。音源定位主要用于自動語音識別、音頻模式識別、說話人發(fā)現(xiàn)及識別。MEMS技術的問世讓麥克風陣列能夠嵌入在上述應用設計中,執(zhí)行音頻信號預處理過程,為應用級提供最好的信息。

該嵌入式單個說話人及其語音定位識別方案基于一個集成ARM處理器和一組MEMS麥克風的原型板。初步測試結(jié)果證明了這一集成方案的可行性,且系統(tǒng)級模塊可以做語音、音頻識別目標板,滿足人機、人與周圍環(huán)境的自然用戶界面的功能要求。

相關閱讀:

通透了解MEMS硅晶振,只需一篇文章即可
MEMS慣性傳感器在工業(yè)控制的未來之路
技術圖解MEMS壓力傳感器的原理與應用

要采購麥克風么,點這里了解一下價格!
特別推薦
技術文章更多>>
技術白皮書下載更多>>
熱門搜索

關閉

?

關閉

主站蜘蛛池模板: 无码帝国www无码专区色综合 | 狠狠狠色丁香婷婷综合久久88 | 久久精品人妻少妇一区二区三区 | 中文字幕久久熟女人妻av免费 | 熟妇人妻久久中文字幕 | 欧美精品一级在线观看 | 第四色在线视频 | 国产欧美一区二区精品97 | 亚洲aⅴ男人的天堂在线观看 | 人人超人人超碰超国产97超碰 | 国产小视频你懂的 | 日本三级一区二区三区 | 97久久草草超级碰碰碰 | 国产精品嫩草影视久久久 | 日本极品在线 | 亚洲欧美高清在线精品一区二区 | 日韩一区二区三区高清电影 | 国产成人精品日本亚洲网站 | 少妇天天爽视频在线看网站 | 国产特级乱淫免费看 | 无码国产成人午夜电影观看 | 在线播放免费人成视频在线观看 | 久久精品国产最新地址 | 亚洲国产成人精品无码区软件 | 国产真实伦种子 | 久久久久久久久无码精品亚洲日韩 | 国产精品后入内射日本在线观看 | 精品中文字幕av | 国产对白刺激真实精品91 | 国产hxc132乱人免费视频 | 奇米影视777四色米奇影院 | 国产成人av在线播放 | va在线 | 亚洲中文有码字幕日本第一页 | 亚洲精品美女久久久久99 | 日本精品videossex 黑人 | 黄色一级免费网站 | 性色m3u8视频在线观看 | 人妻激情偷乱视频一区二区三区 | 亚洲a∨精品一区二区三区 欧美日国产 | 亚洲 国产 另类 精品 专区 | 亚洲国产成人久久综合人 | 综合性色| 成人在线视频一区二区 | 日产幕无线码三区在线 | 深爱激情五月婷婷 | 亚洲高清一区二区三区不卡 | 色欲视频综合免费天天 | 亚洲欧美日本一区二区三区 | 久久精品国产精品亚洲色婷婷 | 日韩激情无码免费毛片 | 国产三级久久久久 | 亚洲国产精品国自产拍av秋霞 | 国产成人69视频午夜福利在线观看 | 成人在线观看免费视频 | 色乱码一区二区三在线看 | 台湾佬成人中文网222vvv | 欧美精品1区2区3区 韩国呻吟大尺度激情视频 产精品视频在线观看免费 国产精品天天看天天狠 | 欧美日韩123 | 天天射天天干天天插 | 国产精品久久一区二区三区 | 亚洲精品综合网在线8050影院 | 成人一区二区免费中文字幕视频 | 美女久久久久久 | 日日躁夜夜躁狠狠躁 | 在线观看国产亚洲 | 日韩专区在线观看 | 中文字幕一区二区三区四区免费看 | 第四色影音先锋 | 国产女王调脚奴免费视频 | 久久精品国产99 | 国产一级二级三级视频 | 香蕉免费一区二区三区在 | 手机福利在线 | 无码免费伦费影视在线观看 | 好爽又高潮了毛片免费下载 | 亚洲精品午夜久久久久久久灵蛇爱 | 亚洲奶水xxxx哺乳期 | 色av专区无码影音先锋 | 国产片自拍 | 国产精品视频免费 | 少妇无码一区二区二三区 | 玖玖玖国产精品视频 | 中国少妇av | 国产在线精品一品二区 | 国产视频一区二区在线 | 成人无遮挡| 天堂а√8在线最新版在线 人人人爽人人爽人人av | 成人无码免费视频在线播 | 男人的天堂色偷偷 | 日本人做受免费视频 | 性猛交xxxx乱大交孕妇2 | 免费无遮挡很爽很污很黄的网站 | 人妻系列无码专区无码中出 | 日本高清视频免费看 | 国产最新精品视频 | 山林妇女勾搭老头av | 久久久亚洲精品一区二区三区 | 麻豆videos |