語(yǔ)音識別及其定點(diǎn)DSP實(shí)現
語(yǔ)音識別研究的根本目的是研究出一種具有聽(tīng)覺(jué)功能的機器,能直接接受人的口呼命令,理解人的意圖并做出相應的反映。語(yǔ)音識別系統的研究涉及微機技術(shù)、人工智能、數字信號處理、模式識別、聲學(xué)、語(yǔ)言學(xué)和認知科學(xué)等許多學(xué)科領(lǐng)域,是一個(gè)多學(xué)科綜合性研究領(lǐng)域。近年來(lái),高性能數字信號處理芯片DSP(Digital Signal Process)技術(shù)的迅速發(fā)展,為語(yǔ)音識別的實(shí)時(shí)實(shí)現提供了可能,其中,AD公司的數字信號處理芯片以其良好的性?xún)r(jià)比和代碼的可移植性被廣泛地應用于各個(gè)領(lǐng)域。因此,我們采用AD公司的定點(diǎn)DSP處理芯片ADSP2181實(shí)現了語(yǔ)音信號的識別。
1 語(yǔ)音識別的基本過(guò)程
根據實(shí)際中的應用不同,語(yǔ)音識別系統可以分為:特定人與非特定人的識別、獨立詞與連續詞的識別、小詞匯量與大詞匯量以及無(wú)限詞匯量的識別。但無(wú)論那種語(yǔ)音識別系統,其基本原理和處理方法都大體類(lèi)似。一個(gè)典型的語(yǔ)音識別系統的原理圖如圖1所示。
語(yǔ)音識別過(guò)程主要包括語(yǔ)音信號的預處理、特征提取、模式匹配幾個(gè)部分。預處理包括預濾波、采樣和量化、加窗、端點(diǎn)檢測、預加重等過(guò)程。語(yǔ)音信號識別最重要的一環(huán)就是特征參數提取。提取的特征參數必須滿(mǎn)足以下的要求:
(1)提取的特征參數能有效地代表語(yǔ)音特征,具有很好的區分性;
(2)各階參數之間有良好的獨立性;
(3)特征參數要計算方便,最好有高效的算法,以保證語(yǔ)音識別的實(shí)時(shí)實(shí)現。
在訓練階段,將特征參數進(jìn)行一定的處理后,為每個(gè)詞條建立一個(gè)模型,保存為模板庫。在識別階段,語(yǔ)音信號經(jīng)過(guò)相同的通道得到語(yǔ)音特征參數,生成測試模板,與參考模板進(jìn)行匹配,將匹配分數最高的參考模板作為識別結果。同時(shí),還可以在很多先驗知識的幫助下,提高識別的準確率。
2 系統的硬件結構
2.1 ADSP2181的特點(diǎn)
AD公司的DSP處理芯片ADSP2181是一種16b的定點(diǎn)DSP芯片,他內部存儲空間大、運算功能強、接口能力強。有以下的主要特點(diǎn):
(1)采用哈佛結構,外接16.67MHz晶振,指令周期為30ns,指令速度為33MI/s,所有指令單周期執行;
(2)片內集成了80 kB的存儲器:16 kB字的(24b)的程序存儲器和16kB字(16b)的數據存儲器;
(3)內部有3個(gè)獨立的計算單元:算術(shù)邏輯單元(ALU)、乘累加器(MAC)和桶形移位器(SHIFT),其中乘累加器支持多精度和自動(dòng)無(wú)偏差舍人;
(4)一個(gè)16b的內部DMA端口(1DMA),供片內存儲器的高速存??;一個(gè)8b自舉DMA(BDMA)口,用于從自舉程序存儲器中裝載數據和程序;
(5)6個(gè)外部中斷,并且可以設置優(yōu)先級或屏蔽等。
由于A(yíng)DSP2181以上的特點(diǎn),使得該芯片構成的系統體積小、性能高、成本和功耗低,能較好地實(shí)現語(yǔ)音識別算法。
評論