利用MEMS麥克風(fēng)陣列定位并識別音頻或語(yǔ)音信源的技
麥克風(fēng)陣列通過(guò)RJ45以太風(fēng)接口或USB OTG FS接口連接其它器件,與其它器件交互是通過(guò)可控制基本板設置的DIP開(kāi)關(guān)實(shí)現。
如下圖所示,每個(gè)MEMS麥克風(fēng)都是由同一個(gè)時(shí)鐘源觸發(fā),時(shí)鐘源由專(zhuān)用振蕩器驅動(dòng),對每個(gè)GPIO端口的一個(gè)引腳輸出1位PDM 高頻信號。輸出PDM數據頻率與輸入時(shí)鐘同步,因此,DMA控制器以同一頻率即音頻捕捉頻率對GPIO端口進(jìn)行讀操作,然后將1 ms音頻數據(每次)保存在存儲器緩沖電路。這時(shí),該緩沖器包含麥克風(fēng)交叉信號,然后軟件利用優(yōu)化的快速解碼函數對數據進(jìn)行解復用處理。最后,PDM 數據通過(guò)數字信號處理環(huán)節,再進(jìn)行PDM轉PCM處理。

圖 5.每個(gè)MEMS麥克風(fēng)都是由同一個(gè)時(shí)鐘源觸發(fā),時(shí)鐘源由專(zhuān)用振蕩器驅動(dòng),對每個(gè)GPIO端口的一個(gè)引腳輸出1位PDM 高頻信號
麥克風(fēng)傳來(lái)的PDM信號經(jīng)過(guò)過(guò)濾和十分之一降采樣率處理,以取得所需頻率和分辨率的信號。麥克風(fēng)輸出的PDM數據頻率(麥克風(fēng)的輸入時(shí)鐘)必須是系統最終音頻輸出的倍數,濾波器管道輸出是一個(gè)16位值,我們將 [-32768, 32767]視為一個(gè)單位增益(0 dB)的輸出范圍。
原先濾波管道產(chǎn)生的數字音頻信號在信號調理前被進(jìn)一步處理。管道第一級是一個(gè)高通濾波器,主要用于除掉信號DC失調。為保護信號質(zhì)量,該濾波級是使用一個(gè)截止頻率不在可聽(tīng)頻率范圍內的 IIR濾波器,管道第二級是一個(gè)基于IIR濾波器的低通濾波器。兩個(gè)濾波器有啟用和禁用以及配置功能;可通過(guò)外部整數變量控制增益。
如上文所述,數據采集有兩個(gè)比特流解決方案,通過(guò)DP開(kāi)關(guān)選擇使用哪一個(gè)方案。當選用 USB且在主機USB插入麥克風(fēng)陣列時(shí),主機將STM32_MEMS_Microphones視為一個(gè)標準的USB音頻設備。因此,主機系統無(wú)需安裝驅動(dòng)軟件。例如, STM32_MEMS_Microphones可直接連接第三方PC音頻采集軟件。當選用以太網(wǎng)時(shí),STM32_MEMS_Microphones發(fā)送 RTP數據包。在網(wǎng)絡(luò )服務(wù)器的以太網(wǎng)設置頁(yè)對目的地IP、設備單播地址和采集參數進(jìn)行配置。
4.結論
音源定位識別是語(yǔ)音識別技術(shù)中的一個(gè)重要的語(yǔ)音預處理環(huán)節,對提高音頻應用和聲控應用性能具有重要意義。音源定位主要用于自動(dòng)語(yǔ)音識別、音頻模式識別、說(shuō)話(huà)人發(fā)現及識別。MEMS技術(shù)的問(wèn)世讓麥克風(fēng)陣列能夠嵌入在上述應用設計中,執行音頻信號預處理過(guò)程,為應用級提供最好的信息。
該嵌入式單個(gè)說(shuō)話(huà)人及其語(yǔ)音定位識別方案基于一個(gè)集成ARM處理器和一組MEMS麥克風(fēng)的原型板。初步測試結果證明了這一集成方案的可行性,且系統級模塊可以做語(yǔ)音、音頻識別目標板,滿(mǎn)足人機、人與周?chē)h(huán)境的自然用戶(hù)界面的功能要求。
評論