ADSP-BF531在嵌入式語(yǔ)音識別系統中的應用
摘要:設計了一個(gè)嵌入式語(yǔ)音識別系統,該系統硬件平臺以ADSP-BF531為核心,采用離散隱馬爾可夫模型(DHMM)檢測和識別算法完成了對非特定人的孤立詞語(yǔ)音識別。試驗結果表明,該系統對非特定人短詞匯的綜合識別率在90%以上。該系統具有小型、高速、可靠以及擴展性好等特點(diǎn);可應用于許多特定場(chǎng)合,有很好的市場(chǎng)前景。文中講述了該系統CODEC、片外RAM、ROM以及CPLD等與DSP的接口設計,語(yǔ)音識別運用的矢量量化、Mel倒譜參數、Viterbi等有關(guān)算法及其實(shí)際應用效果。
關(guān)鍵詞:ADSP-BF531;語(yǔ)音識別;離散隱馬爾可夫模型;非特定人;孤立詞
自上世紀70年代以來(lái),國內外的專(zhuān)家們在語(yǔ)音識別研究領(lǐng)域內取得了重大突破,先后出現了動(dòng)態(tài)時(shí)間規整技術(shù)(DTW)、隱馬爾可夫模型(HMM)和人工神經(jīng)網(wǎng)絡(luò )(ANN)等3種主要方法。DTW雖然在孤立詞語(yǔ)音識別中取得了不錯的性能,但其要求的存儲量和計算量太大;ANN雖然前景看好但其目前尚未有突破性進(jìn)展,目前它們都難以在工程中得到廣泛的應用。HMM算法使語(yǔ)音識別的計算量得到大大減少,而且正確率較高,從而在語(yǔ)音識別中得到廣泛引用。
筆者在以ADSP-BF531為核心構建的嵌入式系統上實(shí)現了對非特定人、孤立詞的語(yǔ)音識別,該系統采用了端點(diǎn)檢測、矢量量化(VQ)和離散隱馬爾可夫模型(DHMM)等算法。
1 ADSP-BF531介紹
ADSP-BF531是ADI公司Blackfin系列的高性能DSP,其最高主頻為400MHz,內有2個(gè)16位MAC,2個(gè)40位ALU,4個(gè)8位視頻ALU,以及1個(gè)40位移位器,RISC式寄存器和指令模型,編程簡(jiǎn)單,編譯環(huán)境友好。
BF531包含豐富的外設,通用外設如UART、帶有PWM(脈沖寬度調制)和脈沖測量能力的定時(shí)器、通用的I/O標志引腳、以及一個(gè)實(shí)時(shí)時(shí)鐘和一個(gè)“看門(mén)狗”定時(shí)器。它還有多個(gè)獨立的DMA控制器,能夠以最小的處理器內核開(kāi)銷(xiāo)完成自動(dòng)的數據傳輸。DMA傳輸可以發(fā)生在A(yíng)DSP-BF531處理器的內部存儲器和任何有DMA能力的外設之間。此外,DMA傳輸也可以在任何有DMA能力的外設和已連接到外部存儲器接口的外部設備之間完成(包括SDRAM控制器、異步存儲器控制器)。具有DMA傳輸能力的外設包括SPORTS、SPI端口、UART和PPI端口。每個(gè)獨立的有DMA能力的外設至少有一個(gè)專(zhuān)用DMA通道。
2 硬件電路設計
該系統電路主要由DSP、音頻編碼器、CPLD、片外SDRAM、FLASH和EEPROM存儲器以及電源、時(shí)鐘等組成。硬件接口如圖1所示。
各器件的主要功能如下:
1)AD73311將經(jīng)前置放大后的麥克風(fēng)音頻信號經(jīng)A/D轉換后通過(guò)串行端口輸入BF531,同時(shí)完成對BF531輸出的數字音頻信號的D/A轉換,而后輸出到功放和喇叭;
2)BF531作為該系統的核心,對信號進(jìn)行特征提取和DHMM識別,同時(shí)對其外圍的器件進(jìn)行控制管理;
3)CPLD完成對DSP的外圍的器件時(shí)序和數據流程控制,以及對LCD顯示屏初始化檢測設置;
4)由于DSP片內的RAM有限,配置了一塊SDRAM用于擴展系統的內存,以滿(mǎn)足程序運行時(shí)數據和指令存儲的要求;
5)EEPROM用于存放DSP程序代碼和系統初始化所需的數據;
6)FLASH用于存放訓練樣本庫。
2.1 AD73311與BF531接口設計
本系統中設計AD73311的采樣率為16 kHz,其與BF531的串口0(SPORT0)連接,通過(guò)DMA方式在單時(shí)鐘周期內完成操作。BF531支持32 bit的串口數據傳輸,由于A(yíng)D73311為16 bit的音頻器件,而且16 bit已可滿(mǎn)足系統精度要求,因此本系統只使用了BF531的主傳輸數據通道,即:DTOPRI和DROPRI,而將第二傳輸數據通道DTOSEC和DROSEC進(jìn)行了屏蔽。AD73311與BF531的連接方式如圖2所示。
2.2 SDRAM接口設計
SDRAM主要用于擴展系統內存,為保證程序運行的裕量及后續升級的需要,這里選用了三星電子的一款容量為32 MB的移動(dòng)式SDRAM,其型號為K4M56163PG。SDRAM與DSP的I/O總線(xiàn)連接,如圖3所示。
評論