基于DSP的人工耳蝸語(yǔ)音處理器設計
摘要:傳統的人工耳蝸語(yǔ)音處理器采用ASIC設計,投入成本高,可移植性差,設計了一種基于A(yíng)的人工耳蝸語(yǔ)音處理器。該處理器采用雙麥克風(fēng)接受語(yǔ)音信號,實(shí)現了語(yǔ)音信號的自適應噪聲消除和CIS(Continuous Interleaved Sampling)方案。同一段語(yǔ)音由DSP采樣處理得到的刺激脈沖與MATLAB采樣處理的結果基本相同。實(shí)驗結果表明,基于DSP的人工耳蝸語(yǔ)音處理器能實(shí)現語(yǔ)音信號中噪聲的消除并得到良好的刺激脈沖。
本文引用地址:http://dyxdggzs.com/article/235932.htm關(guān)鍵詞:DSP;人工耳蝸;自適應噪聲消除;語(yǔ)音處理器
人工耳蝸又稱(chēng)人造耳蝸、電子耳蝸,是目前唯一可以幫助重度耳聾患者恢復聽(tīng)覺(jué)的裝置。相對于助聽(tīng)器將聲音放大改善耳聾患者的聽(tīng)力,人工耳蝸是將聲音轉換成電信號,然后以微弱電流刺激聽(tīng)覺(jué)神經(jīng)纖維的形式傳遞聲音信息,從而產(chǎn)生聽(tīng)覺(jué)。目前商用的人工耳蝸一般由體外語(yǔ)音處理器和體內植人體組成,體外部分由麥克風(fēng)、語(yǔ)音處理器和編碼發(fā)射器組成,體內部分由接收解碼器、刺激器和電極整列組成,并通過(guò)手術(shù)植入患者的體內。目前國內外商用的人工耳蝸語(yǔ)音處理器均采用ASIC設計,投入成本高,可移植性差。隨著(zhù)現代微電子技術(shù)的發(fā)展,采用通用集成電路設計實(shí)用可靠的人工耳蝸已成為可能,其低成本、移植性好的特性將有助于人工耳蝸更好的普及。該系統基于TI公司的16位定點(diǎn)處理器,由完成語(yǔ)音采集和A/D轉換,系統設計包括硬件設計部分和軟件設計部分。本設計采用雙麥克風(fēng)接收語(yǔ)音輸入的自適應噪聲消除技術(shù),改善了在低信噪比環(huán)境中的語(yǔ)音識別效果。為了提高系統的運行速度、降低系統的功耗,對軟件設計部分進(jìn)行了優(yōu)化。
1 帶自適應噪聲消除技術(shù)的CIS算法
1.1 自適應噪聲消除原理
在低信噪比的環(huán)境下,耳聾患者的語(yǔ)音識別率大幅下降?;谧赃m應濾波器的噪聲消除法能有效的增強語(yǔ)音,消除背景噪聲,從而提高患者的語(yǔ)音識別率。本文中語(yǔ)音采集部分利用了兩個(gè)麥克風(fēng)接收語(yǔ)音,經(jīng)過(guò)采樣后作為兩個(gè)通道的輸入信號,輸入信號中均包括語(yǔ)音信號成分s和噪聲成分n。假設麥克風(fēng)1的采樣結果為s1+n1,麥克風(fēng)2的采樣結果為s2+n2。由于麥克風(fēng)1和麥克風(fēng)2分別對同一環(huán)境中的聲音進(jìn)行采樣,s1和s2為相關(guān)信號,n1和n2為相關(guān)信號。假設麥克風(fēng)1和麥克風(fēng)2收到的語(yǔ)音信號一樣,即s1等于s2。通過(guò)兩路信號相加得到主通道輸入信號x1=2s1+n1+n2,通過(guò)兩路信號相減得到參考通道輸入信號x2=n1-n2。由于主通道語(yǔ)音中的噪聲n1+n2與參考噪聲n1-n2是相關(guān)的,參考通道中的自適應濾波器在接收n1-n2以后使輸出在最小均方誤差下最接近主通道噪聲n1+n2。輸出端e得到了消除噪聲后的增強語(yǔ)音信號。本文中自適應濾波器采用了歸一化LMS算法,當信噪比較大時(shí),采用較小的收斂因子,減少穩定失調誤差;當信噪比較小時(shí),采用較大的收斂因子,加快算法的收斂速度。自適應噪聲消除原理如圖1所示。

1.2 帶自適應噪聲消除技術(shù)的CIS方案
文中設計的人工耳蝸語(yǔ)音處理器采用CIS方案,即連續間隔采樣方案(Continuous Interleaved Sampling,CIS)。語(yǔ)音信號先經(jīng)過(guò)預加重處理,以補償語(yǔ)音信號中的高頻成分,然后做FFT變換,經(jīng)n個(gè)帶通濾波器后劃分為與刺激電極相對應的通道,對各個(gè)通道能量求和并利用對數或指數函數壓縮已提高患者的聽(tīng)力動(dòng)態(tài)范圍。帶自適應噪聲消除技術(shù)的CIS方案如圖2所示。

2 硬件結構與設計
本系統以TMS320VC5509A DSP為核心,TLV320AIC23語(yǔ)音Codec芯片等其他外設為輔助設備。TMS320VC5509A控制系統的外設和處理CIS算法程序,TLV320AIC23對外部聲音進(jìn)行采樣和A/D轉換。TMS320VC5509A是TI公司推出的一款高性能低功耗的16位定點(diǎn)數字信號處理器,它擁有豐富的片內資源,能方便的控制其他設備,輸出處理結果等。TLV320AIC23具有很低的功耗,在A(yíng)DC和DAC的噪音可分別達到90 dB和100 dB。此外TLV320AIC23支持MIC和LINE IN兩種輸入方式,內部ADC和DAC轉換模塊均帶有完整的數字濾波器,可以在8 kHz到96 kHz的采樣頻率范圍內傳輸數據寬度為16位,20位,24位,32位的數據。
語(yǔ)音采集芯片TLV320AIC23與主處理芯片TMS320VC5509A的接口電路如圖3所示。

DSP與AIC23的接口有兩個(gè),一個(gè)是控制接口采用I^2C模塊,通過(guò)編程完成對AIC23的配置;一個(gè)是數據音頻接口,通過(guò)MCBSP0傳輸數據。
AIC23的控制接口有SPI/和I^2C兩種工作方式,由于VC5509A片內外設含有I^2C模塊.因此使用I^2C方式控制AIC23更為方便。此時(shí)VC5509A作為I^2C總線(xiàn)的主設備,AIC23作為從設備。在I^2C總線(xiàn)上AIC23有7位外設地址,9位寄存器的設置值。SCL和SD1分別是AIC23的控制端口和數據輸入端,分別和VC5509的I^2C模塊端口SCL,SDA相連。TLV3320AIC23的數據音頻接口支持右判,左判,I^2S和DSP 4種接口模式。本系統采用DSP模式,把AIC23設為主模式,DSP設為從模式,即MCBSP0的移位時(shí)鐘和幀同步時(shí)鐘全部由AIC23提供。在幀同步脈沖到來(lái)時(shí)第一個(gè)數據字即為左通道數據,右通道數據緊跟著(zhù)左通道數據。
語(yǔ)音是時(shí)變的,非平穩的隨機過(guò)程,但由于語(yǔ)音的形成過(guò)程與與人類(lèi)發(fā)音系統的生理結構密切相關(guān),通常假設語(yǔ)音信號是短時(shí)平穩的,即在10至30 ms的時(shí)間段內其頻譜特性和一些物理特征參量可近似的看作是不變的。因此語(yǔ)音信號要進(jìn)行分幀處理,在采樣率為8 kHz時(shí)可將幀長(cháng)取為N=256較為合適。
3 系統軟件設計
本系統中語(yǔ)音信號由LINE IN輸入,LLINE IN和RLINEIN分別對應自適應噪聲消除原理圖中的麥克風(fēng)1和麥克風(fēng)2,語(yǔ)音信號分別經(jīng)過(guò)AIC 23內部的A/D轉換后,通過(guò)MCBSP0通道傳送到VC5509A內。VC5509A對這些語(yǔ)音數據進(jìn)行CIS算法處理,得到各個(gè)通道的刺激脈沖。
系統軟件設計分為系統初始化,系統中斷處理程序和CIS算法程序。系統的初始化包括設置時(shí)鐘發(fā)生器,MCBSP初始化,I^2C初始化以及對AIC23控制寄存器的配置。系統中斷處理程序設置一個(gè)標志位,每中斷一次左右聲道各采集一個(gè)數據,當采集滿(mǎn)一幀時(shí)能使采樣值保存在兩個(gè)數據緩沖區的另一個(gè)緩沖區中。系統中主程序一直處于循環(huán)處理過(guò)程,在一幀信號執行完CIS算法程序后,等待下一幀信號接收完畢,然后重新執行CIS算法程序。為保證語(yǔ)音信號處理的連續性,CIS算法處理時(shí)間應當小于一幀數據的采樣時(shí)間。本系統CPU時(shí)鐘為144 MHz,采樣頻率8 kHz,中斷頻率8 kHz,因此每125μs采集一個(gè)點(diǎn),采集一幀256個(gè)數據需32 ms,即每隔32 ms輸出1個(gè)刺激脈沖,CIS子程序運行一次需23.1 ms。圖4為系統設計流程圖。

4 設計結果驗證
文中設計的CIS算法首先用MATLAB進(jìn)行驗證,然后修改成C語(yǔ)言在DSP上實(shí)現。為了更方便的分析算法結果,文中利用了集成在MATLAB 7.0中的CCSLlink工具。利用該工具可在MATLAB環(huán)境下完成對CCS和DSP目標板的操作,自動(dòng)實(shí)現調試,數據傳遞和驗證。在創(chuàng )建好CCSIDE連接對象后,利用MATLAB把工程文件加載到CCSIDE中,經(jīng)過(guò)編譯連接生成DSP可執行文件。把可執行文件加載到DSP目標板,運行程序,由waver ead函數讀取wav格式音頻文件。該音頻文件是立體聲的波形文件,采樣精度16位,采樣率22 050 Hz,左聲道模擬麥克風(fēng)1,右通道模擬麥克風(fēng)2。為了模擬真實(shí)環(huán)境中的噪聲,左右聲道各加入了相關(guān)的高斯白噪聲,通過(guò)LINE IN連接線(xiàn)接到DSP目標板。先將自適應濾波前后的結果進(jìn)行對比,如圖5所示。

自適應消噪后的語(yǔ)音信號經(jīng)過(guò)預加重,FFT變換,帶通濾波,能量求和及非線(xiàn)性壓縮后可得到與每個(gè)電極相對應的刺激脈沖。以第一通道為例,同一語(yǔ)音分別經(jīng)DSP和MATLAB采樣處理的結果對比如圖6所示。

5 CIS算法實(shí)現優(yōu)化
功耗是人工耳蝸語(yǔ)音處理器設計需要考慮的重要內容,本系統在降低功耗方面做了一些努力。由于語(yǔ)音實(shí)時(shí)采樣分析的需要,每幀數據的處理時(shí)間必須小于每幀數據的采樣時(shí)間。CIS算法優(yōu)化后減少了每幀數據的處理時(shí)間,可以使CPU工作在較低的工作頻率,一定程度上降低了系統功耗。CIS算法中開(kāi)平方運算和FFT運算需要較多的處理時(shí)間,其中浮點(diǎn)數開(kāi)平方運算需要10 ms,浮點(diǎn)數FFT運算需要51 ms。本算法中采用了DSP函數庫中的sqrt_16函數和cfft函數,這些函數全部為優(yōu)化過(guò)的匯編語(yǔ)言,可有C?語(yǔ)言方便調用,執行速度得到了很大的提高。
6 結束語(yǔ)
文中介紹了基于16位定點(diǎn)DSP芯片TMS320VC5509A的人工耳蝸語(yǔ)音處理器的硬件設計和軟件設計。為了提高低噪聲中的語(yǔ)音識別率,本設計采用了雙麥克風(fēng)接收語(yǔ)音輸入的自適應消噪技術(shù)。聲音經(jīng)過(guò)語(yǔ)音Codec芯片TLV320AIC23采集并進(jìn)行A/D轉換后傳輸到DSP內。系統運行結果表明,該系統可以實(shí)現語(yǔ)音信號中噪聲的消除,并得到良好的電極刺激脈沖,其低功耗、低成本、移植性好的特性將有助于人工耳蝸更好的普及。
射頻卡相關(guān)文章:射頻卡原理
評論