基于DSP的語(yǔ)音識別計算器設計
摘要:為解決特殊群體使用計算器困難的問(wèn)題,設計了一種基于TMS320VC5509 DSP的可語(yǔ)音識別的計算器系統。該計算器系統的核心是采用HMM算法建立語(yǔ)音識別模型。通過(guò)對實(shí)時(shí)語(yǔ)音信號(數字、運算符號等語(yǔ)音)進(jìn)行處理,將得到的參數與模板庫參數進(jìn)行匹配并加以識別,利用TMS320VC5509 DSP自帶的計算模塊實(shí)現語(yǔ)音信號整數100以?xún)鹊募?、減、乘、除等計算功能。實(shí)驗結果表明,該計算器系統在低噪聲場(chǎng)合和高噪聲場(chǎng)合下識別率分別達到94.73%和76.55%。
關(guān)鍵詞:語(yǔ)音識別;DSP;HMM;計算器;TMS320VC5509
隨著(zhù)電子技術(shù)的高速發(fā)展,現代普通民用計算器在保留基本的加減乘除等運算外,加入了大量如三角函數、冪函數等比較復雜的運算。但是其基本的操作沒(méi)有發(fā)生變化,依然是運用手指操作,對于需要進(jìn)行實(shí)時(shí)數字計算的一些特殊人群(殘疾人士)或是在一些特殊場(chǎng)合在無(wú)法手動(dòng)操作計算器的情況下,用加入了語(yǔ)音識別模塊的計算器來(lái)進(jìn)行實(shí)時(shí)數字計算就有相當的必要。
語(yǔ)音識別技術(shù)是人機最自然、最簡(jiǎn)潔的交流方式,它就是讓機器能夠自動(dòng)識別并理解說(shuō)話(huà)人要表達的意思,將語(yǔ)音信號轉變?yōu)檎_的文本或者命令的高科技技術(shù)。根據實(shí)際的應用,語(yǔ)音識別可以分為:特定人與非特定人的識別、孤立詞與連續詞的識別、中小詞匯量與無(wú)限詞匯量的識別。
考慮到成本及使用范圍因素,本文中應用的是基于TMS320VC5509 DSP的非特定人、孤立詞、小詞匯量的語(yǔ)音識別系統。通過(guò)實(shí)際測試,使用該DSP的語(yǔ)音識別系統有著(zhù)較高的實(shí)時(shí)性、識別率,基于該系統的計算器對實(shí)時(shí)數字計算有較高準確性,基本能解決特殊群體和特殊地點(diǎn)使用計算器困難的情況。
1 系統硬件設計
1.1 語(yǔ)音識別系統
語(yǔ)音識別的基本原理框圖如圖l所示。語(yǔ)音識別過(guò)程主要包括語(yǔ)音信號前處理、特征提取、模式匹配等部分。語(yǔ)音信號輸入之后,預處理和數字化是進(jìn)行語(yǔ)音識別的前提條件。特征提取是進(jìn)行語(yǔ)音信號訓練和識別必不可少的步驟,本文采用的是提取每幀的Mel系數的倒譜參數作為語(yǔ)音信號的特征值。模板匹配算法目前有DTW算法、HMM隱馬爾科夫模型、ANN人工神經(jīng)網(wǎng)絡(luò )等。本文采用HMM隱馬爾科夫模型的方法,提取出的特征值存入參考模式庫中,用來(lái)匹配待識別語(yǔ)音信號的特征值。匹配計算是進(jìn)行語(yǔ)音識別的核心部分,由待識別人的語(yǔ)音經(jīng)過(guò)特征提取后,與系統訓練時(shí)產(chǎn)生的模板進(jìn)行匹配,在說(shuō)話(huà)人辨認中,取與待識別語(yǔ)音相似度最大的模型所對應的語(yǔ)音作為識別結果。
1.2 系統硬件結構
圖2為系統硬件結構框圖。此系統的核心器件是TI公司的TMS320VC5509定點(diǎn)DSP。在本系統中,它不僅是語(yǔ)音識別的核心,還負責計算器的運算部分。TMS320VC5509是系統的運算處理單元,具有2個(gè)乘法器(MAC),4個(gè)累加器(ACC);40位、16位的算術(shù)邏輯單元(ALU)各一個(gè),這大大增強了DSP的運算能力;指令字長(cháng)不只單一的16位,可擴展到最高48位,數據字長(cháng)16位;可通過(guò)USB接口對TMS320VC5509燒寫(xiě)程序而不必借助仿真器。正是基于這些優(yōu)點(diǎn),選擇該器件可節省開(kāi)發(fā)資金,減小電路板面積。DSP與TLV320AIC23的接口電路如圖3所示。
評論