<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 基于TMS320VC5509A的語(yǔ)音識別與控制系統

基于TMS320VC5509A的語(yǔ)音識別與控制系統

作者: 時(shí)間:2008-07-17 來(lái)源:網(wǎng)絡(luò ) 收藏
(Speech Recognition)是機器通過(guò)訓練和匹配過(guò)程把信號轉變?yōu)橄鄳奈谋净蛎畹募夹g(shù)。關(guān)于技術(shù),先后出現了動(dòng)態(tài)時(shí)間彎折(DTW)、隱馬爾可夫和人工神經(jīng)網(wǎng)絡(luò )三種主要方法[1]。由于每種方法都涉及大量的乘加運算,并且計算精度是算法性能的有效保障,因此對處理器的運算能力要求較高。近年大規模集成電路的快速發(fā)展,為語(yǔ)音的實(shí)現創(chuàng )造了硬件條件。目前,DSP的語(yǔ)音識別系統多以浮點(diǎn)型DSP為主[2],但其成本較高。本文以TI公司的較低成本定點(diǎn)DSP 作為處理芯片。在軟件編程時(shí),考慮運算速度和精度對性能的影響,將定點(diǎn)運算與定點(diǎn)DSP的浮點(diǎn)運算巧妙結合,既保證了處理速度,又提高了運算精度和識別率。此外,該系統的DSP芯片自帶USB接口,可使程序下載不借助于硬件仿真器,便于推廣應用;可編程邏輯器件(CPLD)能夠根據識別結果發(fā)出相應的控制信號以驅動(dòng)各種控制對象;外擴Flash達1M16Bit,不僅能存儲較多數量的模板,也可實(shí)現程序的并行加載,使系統能夠脫機運行,便于攜帶。通過(guò)對語(yǔ)音信號的采集與識別,能夠完成對特定人、小詞匯量、孤立詞的識別,并且能發(fā)出相應的控制信號,以達到系統的設計要求。實(shí)踐驗證了該系統具有可靠性、穩定性和靈活性。
1 語(yǔ)音識別原理
語(yǔ)音識別原理框圖如圖1所示。語(yǔ)音信號輸入之后,預處理和數字化是進(jìn)行語(yǔ)音識別的前提條件。其中,預處理主要是進(jìn)行預濾波,保留正常人的300~3400Hz的語(yǔ)音信號;數字化是要進(jìn)行A/D轉換及抗混疊等處理;特征提取是進(jìn)行語(yǔ)音信號訓練和識別必不可少的步驟。能夠體現語(yǔ)音信號特征的參數包括:(1)LPC的倒譜參數;(2)Mel系數的倒譜參數;(3)采用前沿數字信號處理技術(shù)的特征分析手段,如小波分析、時(shí)/頻域分析、人工神經(jīng)網(wǎng)絡(luò )等。本文采用基于LPC的倒譜參數表示方法,提取出的特征值存入參考模式庫中,用來(lái)匹配待識別語(yǔ)音信號的特征值。匹配計算是進(jìn)行語(yǔ)音識別的核心部分,由待識別人的語(yǔ)音經(jīng)過(guò)特征提取后,與系統訓練時(shí)產(chǎn)生的模板進(jìn)行匹配,在說(shuō)話(huà)人辨認中,取與待識別語(yǔ)音相似度最大的模型所對應的語(yǔ)音作為識別結果,這就是語(yǔ)音識別的整個(gè)過(guò)程[1]。


2 硬件結構部分
本系統的硬件結構框圖如圖2所示。


此系統的核心器件是TI公司的定點(diǎn)DSP芯片。它是系統的運算處理單元,具有2個(gè)乘法器(MAC),4個(gè)累加器(ACC);40位、16位的算術(shù)邏輯單元(ALU)各一個(gè),這大大增強了DSP的運算能力;指令字長(cháng)不只單一的16位,可擴展到最高48位,數據字長(cháng)16位;在144MHz下工作,指令周期可達6.94ns。還提供高速的多通道緩沖串口McBSP(Multi-channel Buffererd Serial Ports),DSP可通過(guò)McBSP與其他DSP、編解碼器等器件相連。McBSP具有全雙工通信,雙緩沖數據寄存器,允許傳送連續的數據流,能夠向CPU發(fā)送中斷,向DMA控制器發(fā)送DMA事件,可設置幀同步脈沖和時(shí)鐘信號的極性等功能,這大大方便了DSP采集音頻信號[3]。除此之外,TMS320VC5509A還提供了更為高效的外部存儲器接口(EMIF),以往DSP的空間選通信號被片選信號取代,而每個(gè)片選信號分別占用不同的地址空間,這樣就不需要外部的譯碼電路,從而實(shí)現了與外部設備的無(wú)縫連接,可使DSP外部存儲空間擴大到滿(mǎn)足系統要求。值得強調的是,可通過(guò)USB接口對TMS320VC5509A燒寫(xiě)程序而不必借助仿真器。正是基于這些優(yōu)點(diǎn),選擇該芯片可節省開(kāi)發(fā)資金,減小電路板面積。
TLV320AIC23是TI公司的一款低成本、低功耗的音頻編解碼芯片(CODEC),在本系統中負責采集語(yǔ)音信號。它與本系統相關(guān)的性能參數如下:(1)支持8kHz~96kHz可調采樣率;(2)與DSP連接,主從類(lèi)型可通過(guò)軟件編寫(xiě)來(lái)實(shí)現;(3)DSP可通過(guò)I2C總線(xiàn)來(lái)配置TLV320AIC23的寄存器;(4)采集語(yǔ)音信號字長(cháng)16/20/24/32Bit;(5)MIC音頻輸入具有強抗噪性;(6)具有可調1~5dB的完整緩存放大系統[4]。
EPM3128ATC100-10可編程邏輯器件(CPLD)在本系統中擔當兩方面的職能:(1)作為控制部件,接收DSP發(fā)出的信號,經(jīng)邏輯判斷后,驅動(dòng)諸如電機、發(fā)光二極管等器件;(2)用于DSP地址線(xiàn)的擴展。TMS320VC5509A只有14根地址線(xiàn),但它的外部存儲空間可以擴展到16MB(字節尋址),顯然,DSP的固有地址線(xiàn)是無(wú)法滿(mǎn)足要求的。本系統采用CPLD完成地址線(xiàn)的擴展[5][6]。
HY57V641620同步動(dòng)態(tài)存儲器(SDRAM),容量為4M16Bit。作為RAM的擴展,大大增強了DSP的存儲與運算能力[7]。
SST39VF1601閃存存儲器(Flash),容量為1M16Bit。在這個(gè)系統中[8],它主要用來(lái)存儲程序代碼。上電后,DSP從外部Flash加載并執行程序代碼,使系統能夠脫機運行。
3 軟件模塊部分
軟件流程如圖3所示。系統采集語(yǔ)音信號后,首先要進(jìn)行預濾波和預加重;接著(zhù)將語(yǔ)音信號進(jìn)行分幀,由于語(yǔ)音信號具有極強的相關(guān)性,因此在分幀時(shí),要考慮幀重復。本文將語(yǔ)音信號以256個(gè)采樣點(diǎn)為一幀,兩幀之間的重復點(diǎn)數為80;然后計算每幀信號的短時(shí)能量與短時(shí)平均過(guò)零率,這也是接下來(lái)進(jìn)行端點(diǎn)檢測的依據;利用門(mén)限判決進(jìn)行端點(diǎn)檢測后,提取每幀信號的LPC系數,作為該幀信號的特征值;最后,用語(yǔ)音信號的特征值與模板逐個(gè)進(jìn)行匹配。相似度最大的模板所對應的語(yǔ)音信號為識別結果,根據識別結果就可以向外發(fā)出控制信號。


3.1 端點(diǎn)檢測
端點(diǎn)檢測就是要從采集的信號中檢測出說(shuō)話(huà)人的命令字。此系統中,對語(yǔ)音信號進(jìn)行了分幀操作,一種簡(jiǎn)便的方法就是獲取說(shuō)話(huà)人命令字的起始幀數,具體操作是通過(guò)求一幀信號的短時(shí)能量和短時(shí)平均過(guò)零率來(lái)判斷的。語(yǔ)音信號的短時(shí)能量分析給出了反應其幅度變化的一個(gè)合適描述方法。一幀語(yǔ)音信號的短時(shí)能量定義為:

短時(shí)過(guò)零率,即指每幀內信號通過(guò)零值的次數,能夠在一定程度上反映信號的頻譜特性。一幀語(yǔ)音信號內短時(shí)平均過(guò)零率定義為:

在正式端點(diǎn)檢測開(kāi)始后,短時(shí)能量與短時(shí)平均過(guò)零率一起做為門(mén)限來(lái)判決說(shuō)話(huà)人命令字的開(kāi)始與結束:連續5幀語(yǔ)音信號超過(guò)門(mén)限值視為說(shuō)話(huà)人命令字的開(kāi)始,連續8幀語(yǔ)音信號低于門(mén)限值視為說(shuō)話(huà)人命令字的結束。
3.2 特征值提取
此系統以語(yǔ)音信號的線(xiàn)性預測系數(LPC)作為特征值。采用自相關(guān)法獲取LPC系數,先計算每幀語(yǔ)音信號的13階自相關(guān)函數,定義為:

得到自相關(guān)函數后,采用萊文遜―杜賓遞推算法計算線(xiàn)性預測系數,得到說(shuō)話(huà)人一個(gè)命令字的LPC系數矩陣,大小為:命令字幀數12。
3.3 模板匹配(DTW算法)
模板匹配就是把上述計算得到的LPC系數矩陣中的元素與事先存在DSP中的模板元素進(jìn)行差值計算。在此系統中,采用動(dòng)態(tài)時(shí)間彎折(DTW)算法:假設參考模板的LPC系數向量序列為X=(x1,x2,…,xI),輸入語(yǔ)音的LPC系數向量序列為Y=(y1,y2,…,yJ),I≠J。DTW算法就是要尋找一個(gè)最佳的時(shí)間規正函數,使待測語(yǔ)音的時(shí)間軸j非線(xiàn)性地映射到參考模板的時(shí)間軸i上,使總的累計差值最小[1]。算法過(guò)程如圖4所示。

圖4中曲線(xiàn)連接起來(lái)的點(diǎn)就是模板與待測語(yǔ)音信號間的距離d(xi(n),yj(n)),亦稱(chēng)為局部匹配距離。DTW算法就是通過(guò)局部?jì)?yōu)化的方法實(shí)現加權距離總和最小,也就是相似度最大,定義為:

3.4 小數的定點(diǎn)運算
在進(jìn)行語(yǔ)音信號處理時(shí),通常要先對其進(jìn)行歸一化,使得語(yǔ)音信號|x(n)|≤1,為后面計算自相關(guān)函數及求LPC系數提供方便。這樣就面臨一個(gè)實(shí)際問(wèn)題:對定點(diǎn)DSP而言,參與數值運算的數是16位二進(jìn)制整型數,而DSP芯片如何處理小數運算呢?方法是確定一個(gè)數的小數點(diǎn)處于16位中的某一位,這也就是數值的定標問(wèn)題,舉例如下:
Q0 定標(19AB)16=(31147)10
Q15定標(19AB)16=(0.95)10
由此可見(jiàn),對于定點(diǎn)DSP芯片內部而言,一個(gè)16位整型數到底表示多少,它本身是不能夠分辨的,必須通過(guò)定標來(lái)確定。進(jìn)行歸一化處理就是把數以Q15形式定標,為以后的運算做好準備[2]。做小數的定點(diǎn)運算時(shí),還要進(jìn)行預運算和移位。預運算就是事先估計運算結果,為下一步移位做準備。其實(shí)現可采用如Matlab等的輔助軟件。由于此系統的識別過(guò)程涉及較多的乘加運算,如幾個(gè)Q15定標的數進(jìn)行加法運算,結果可能出現溢出現象,如果不能進(jìn)行很好的預運算,將對后面的運算產(chǎn)生很大影響;移位是小數做定點(diǎn)運算的具體操作。做加、減、乘、除法時(shí),要嚴格按照相應的操作方法,每做一個(gè)四則運算都要參照實(shí)際情況,遵循先移位、再做運算、最后再移位的步驟,以在精度損失最少的情況下保證運算結果的可靠性。
3.5 定點(diǎn)DSP做浮點(diǎn)運算
定點(diǎn)運算是以DSP的實(shí)際存儲形式(16位二進(jìn)制整型)為數值格式進(jìn)行加、減、乘、除等四則運算,允許數值的表示范圍是:(-32768)10~(32767)10。定點(diǎn)DSP的浮點(diǎn)運算是人為地開(kāi)辟兩個(gè)16位存儲單元來(lái)表示一個(gè)數值,其中一個(gè)用來(lái)存儲尾數,另一個(gè)用來(lái)存儲指數,按照自然科學(xué)計數法進(jìn)行四則運算。顯而易見(jiàn),這樣的存儲計算方法,其精度和動(dòng)態(tài)表示范圍都遠遠高于定點(diǎn)運算。
為降低成本,本系統選擇了一款定點(diǎn)DSP。由于端點(diǎn)檢測、模板匹配對精度要求不高,所以采用定點(diǎn)算法進(jìn)行小數運算;計算自相關(guān)系數、提取LPC系數時(shí),要求精度高,因此采用浮點(diǎn)算法進(jìn)行小數運算。這也意味著(zhù),在端點(diǎn)檢測完成之后,要先將定點(diǎn)運算轉換為浮點(diǎn)運算;提取LPC系數之后,再將浮點(diǎn)運算轉換為定點(diǎn)運算進(jìn)行匹配。以犧牲少量運算時(shí)間為代價(jià),適當提高運算精度和識別率。實(shí)驗證明,這是可行的。
4 測試方法及結果
下面用兩種實(shí)驗方法來(lái)測試此系統的性能。
實(shí)驗1:用CPLD的輸出信號來(lái)驅動(dòng)兩個(gè)步進(jìn)電機R和L,某特定人的四個(gè)命令信號“走”,“左”,“右”,“?!笨刂七@兩個(gè)電機的運轉。對應的實(shí)驗現象:走―L、R同時(shí)轉;左―L轉,R停;右―L停,R轉;停―R、L都不轉。
實(shí)驗2:用CPLD的輸出信號驅動(dòng)四個(gè)發(fā)光二極管A、B、C、D,某特定人的四個(gè)命令信號“1”,“2”,“3”,“4”來(lái)控制相應發(fā)光二極管的亮滅。對應的實(shí)驗現象:1―A亮,其余滅;2―B亮,其余滅;3―C亮,其余滅;4―D亮,其余滅。
以上兩個(gè)實(shí)驗,除了測試識別率外,還要比較在計算自相關(guān)函數和提取LPC系數時(shí),分別采用定點(diǎn)算法、浮點(diǎn)算法所消耗機器周期的個(gè)數,本系統DSP的機器周期為83.28ns。由于每次采集的命令字幀長(cháng)不確定,以進(jìn)行十次實(shí)驗消耗的機器周期的平均值來(lái)統計,測試結果如表1所示。


由表1可見(jiàn),在相同的測試條件下,當采用浮點(diǎn)運算計算自相關(guān)函數和提取LPC系數時(shí),盡管識別率高于定點(diǎn)運算,但是系統消耗了更多的運算時(shí)間。
本文設計的語(yǔ)音識別與,具有體積小、成本低、便于攜帶等優(yōu)點(diǎn)。在實(shí)現系統功能的同時(shí)又使板級調試與系統升級變得極為方便,因此可以作為一個(gè)處理語(yǔ)音信號的通用硬件平臺,亦可完成語(yǔ)音編碼、聲回波對消等算法的實(shí)現。系統在DSP提供的地址線(xiàn)少于Flash地址線(xiàn)的情況下,由CPLD擴展了DSP的地址線(xiàn)。在不借助硬件仿真器的情況下,實(shí)現了對Flash的在線(xiàn)燒寫(xiě),并采用二次引導的方法,完成了程序的并行加載,使系統能夠脫機運行。由CPLD發(fā)出相應的識別控制信號,能夠驅動(dòng)電動(dòng)機及指示燈等。測試結果表明,該系統處理速度快,運行穩定可靠,達到設計要求。
參考文獻
[1] 韓紀慶,張磊,鄭鐵然.語(yǔ)音信號處理[M].北京:清華大學(xué)出版社,2004.
[2] 張雄偉,陳亮,徐光輝.DSP芯片的原理與開(kāi)發(fā)應用[M].北京:電子工業(yè)出版社,2004.
[3] Texas Instruments.TMS320VC5509A Fixed-Point DigitalSignal Processor[EB/OL].Texas Instruments Inc,2006,3.www.ti.com.
[4] Texas Instruments.TLV320AIC23 Data Manual[EB/OL]. Texas Instruments Inc,2002,1.www.ti.com.
[5] Texas Instruments.TMS320VC5509 Evaluation Module Technical Reference[EB/OL].Texas Instruments Inc,2002,1.www.ti.com.
[6] Altera.MAX 3000A Programmable Logic Device FamilyDate Sheets[EB/OL].Altera Corporation,2003,6.lit_req@altera.com.
[7] Hynix.HY57V641620HG Data Sheets[EB/OL].Hynix Semiconductor,2002,1.www.21ic.com.
[8] Silicon Storage Technology.SST39VF1601 Data Sheets[EB/OL].Silicon Storage Technology,Inc,2003,11.www.sst.com.



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>