基于Windows CE的語(yǔ)音口令識別系統的設計
圖1 語(yǔ)音口令識別系統的程序流程圖。
當語(yǔ)音口令識別系統采集到命令語(yǔ)音信號后,要提取參數,做出比較判斷,調用相應語(yǔ)音口令識別算法。對每條語(yǔ)音口令信號,先切除靜音,進(jìn)行預加重處理,然后通過(guò)Hamming窗分幀,幀長(cháng)和幀移分別為20ms和10ms,對每一幀語(yǔ)音信號提取16階MFCC和△MFCC一共32維參數作為特征矢量。
語(yǔ)音口令識別軟件系統由許多不同的語(yǔ)音信號預處理、識別算法和其它子程序組成,為了實(shí)現參數的傳遞,每個(gè)程序執行后的參數以文件的形式輸出,而這些程序的調用先后順序和參數的輸入輸出文件的位置等都由一個(gè)主程序管理。
在Windows CE中,編寫(xiě)可執行程序,需要調用應用程序編程接口A(yíng)PI(Application Programming Interface)函數,并且要設定程序入口點(diǎn)。調用過(guò)程為:
無(wú)論是進(jìn)行語(yǔ)音口令訓練還是語(yǔ)音口令識別操作,都需要對語(yǔ)音口令信號的采集和實(shí)時(shí)處理程序,所以對語(yǔ)音口令信號的采集和實(shí)時(shí)處理程序是語(yǔ)音口令識別系統軟件中的重要部分之一。對于語(yǔ)音音頻接口的管理是通過(guò)Windows CE 5.0里的API函數完成的,對語(yǔ)音口令信號的采集和實(shí)時(shí)處理程序流程圖如圖2所示。
評論