基于SPCE061A的語(yǔ)音識別技術(shù)應用
SPCE061A是凌陽(yáng)公司設計的一種16位單片機,該款單片機資源豐富,具有極高的性?xún)r(jià)比,該單片機內置有2路DA轉換,8路AD轉換及在線(xiàn)仿真,并且有16×16位的乘法運算和內積運算的DSP功能,這為它進(jìn)行復雜的語(yǔ)音數字信號的壓縮編碼與解碼提供了便利,還可以做數字濾波器。這些特點(diǎn)為我們進(jìn)行在語(yǔ)音處理尤其是語(yǔ)音識別領(lǐng)域的應用提供了便利。
語(yǔ)音識別技術(shù)在各個(gè)層面均有廣泛的應用前景。電腦軟件領(lǐng)域,例如:語(yǔ)音命令、語(yǔ)音輸入,對話(huà)系統、查詢(xún)系統、教學(xué)軟件、游戲軟件等;消費性電子產(chǎn)品領(lǐng)域,例如:電子記事本、聲控玩具、語(yǔ)音拔號功能的手機等;工業(yè)產(chǎn)品領(lǐng)域,例如:車(chē)用移動(dòng)電話(huà)、車(chē)用導航系統等;電話(huà)系統領(lǐng)域,例如:語(yǔ)音識別總機服務(wù)、語(yǔ)音拔號、語(yǔ)音訂票訂位等。
1 語(yǔ)音識別基本原理
語(yǔ)音識別就是讓機器聽(tīng)得懂人們所講的話(huà),基本框架如圖1和圖2所示。圖1是語(yǔ)音訓練模型的部分:將已知的語(yǔ)音信號經(jīng)由端點(diǎn)偵測(End Point Detection)及特征參數求取(Feature Extraction)而產(chǎn)生標準的語(yǔ)音參考樣本。
圖2是語(yǔ)音識別的部分。將待測的語(yǔ)音信號,經(jīng)與圖1同樣的處理步驟求得特征參數后再與前述的標準語(yǔ)音參考樣本對比,找出最相似的參考樣本作為辨識的結果。
2 語(yǔ)音識別分類(lèi)
若依使用者的限制而言可分為特定人語(yǔ)音與非特定人語(yǔ)音識別。
2.1 特定人語(yǔ)音識別
使用特定人語(yǔ)音識別系統前,須先把使用者的語(yǔ)音參考樣本存入當成比對的資料庫,即特定人語(yǔ)音識別系統在使用前就必須先進(jìn)行圖1的訓練學(xué)習步驟。
2.2 非特定人語(yǔ)音識別
使用本系統前根本不需要先學(xué)習,便能直接使用。一套最佳的語(yǔ)音識別系統是不須經(jīng)過(guò)學(xué)習便能進(jìn)行語(yǔ)音識別,但通常辯識率都比較低。
另外以說(shuō)話(huà)方式的連續是否又可分為非連續語(yǔ)音識別和連續語(yǔ)音識別。對于非連續語(yǔ)音來(lái)說(shuō),識別所說(shuō)的每一個(gè)字必須分開(kāi)辨認;而連續語(yǔ)音識別可以一般自然流利的說(shuō)話(huà)方式來(lái)進(jìn)行人性化的語(yǔ)音識別,但由于關(guān)系到相連音的問(wèn)題,很難達到好的辨認效果。
3 SPCE061A芯片特性簡(jiǎn)介
SPCE061A是一款基于μ′nSP內核的16位單片機,其芯片特性如下:(1)工作電壓:內核工作電壓VDD為3.0~3.6V(CPU),I/O口工作電壓VDDH為2.4~5.5V(I/O);(2)CPU時(shí)鐘:0.32MHz~49.152MHz;(3)內置2K字SRAM和32K閃存ROM;(4)系統處于備用狀態(tài)下(時(shí)鐘處于停止狀態(tài)),耗電小于2μA@3.6V;(5)具備觸鍵喚醒的功能;(6)32位通用可編程輸入/輸出端口;(7)2個(gè)16位可編程定時(shí)器/計數器(可自動(dòng)預置初始計數值);(8)7通道10位電壓模-數轉換器(ADC)和單通道聲音模-數轉換器;(9)2個(gè)10位DAC(數-模轉換)輸出通道;(10)14個(gè)中斷源可來(lái)自定時(shí)器A/B,時(shí)基,2個(gè)外部時(shí)鐘源輸入,鍵喚醒;(11)具備串行設備接口;(12)低電壓復位(LVR)功能和低電壓監測(LVD)功能;(13)內置在線(xiàn)仿真(ICE,In-Circuit Emulator)接口。
SPCE061A的內部結構框圖如圖3所示。
4 SPCE061A的語(yǔ)音識別應用
4.1 硬件電路簡(jiǎn)述
SPCE061A的D/A轉換通道的硬件實(shí)現大致有兩類(lèi),一類(lèi)是直接采用數/模轉換器(DAC)方式,另一類(lèi)是直接采用脈寬調制(PWM)驅動(dòng)方式,SPCE061A音頻輸出的結構就是由兩個(gè)DAC通道或一個(gè)PWM驅動(dòng)通道構成。兩類(lèi)實(shí)現方式實(shí)質(zhì)都為數/模轉換,都是將數字信號轉換成電流模擬信號輸出。SPCE061A的音頻輸出采用雙通道數/模轉換DAC方式,即數字信號通過(guò)10位DAC轉換成3mA驅動(dòng)的電流模擬信號輸出。語(yǔ)音提示輸出直接采用DAC通道,經(jīng)信號放大后,由揚聲器輸出。
語(yǔ)音識別電路比較簡(jiǎn)單,MIC選用駐極體話(huà)筒。駐極體話(huà)筒具有結構簡(jiǎn)單、重量輕、體積小、無(wú)方向性、頻率響應寬、保真度好等優(yōu)點(diǎn),它的偏壓由SPCE061A的VMIC管腳提供。
4.2 系統軟件
語(yǔ)音識別分為語(yǔ)音樣板訓練和語(yǔ)音識別兩個(gè)過(guò)程。我們將標準模式的存儲空間稱(chēng)之為“詞庫”,而把標準模式稱(chēng)之為“樣板”。所謂語(yǔ)音樣板訓練,即將待識別的命令進(jìn)行頻譜分析,提取特征參數作為識別的標準模式。語(yǔ)音識別的過(guò)程是提取語(yǔ)音命令的特征參數,與詞庫中的樣板比較,取相似度最好的樣板命令序號作為識別結果。凌陽(yáng)科技公司提供語(yǔ)音樣板訓練工具和語(yǔ)音識別庫函數,每次可識別30條語(yǔ)音命令,命令較多可以分多組進(jìn)行,語(yǔ)音識別流程見(jiàn)圖4所示。
其中,BSR-GetResult函數為啟動(dòng)辯識,當無(wú)命令識別出來(lái)時(shí),返回0;識別器停止、未初始化或識別未激活返回-1;當識別不合格時(shí)返回-2;當識別出來(lái)時(shí)返回命令的序號。部分程序源代碼如下。
以上程序代碼是SPCE061A在一種基于特定人智能語(yǔ)音識別電動(dòng)小車(chē)上的應用。經(jīng)大量實(shí)驗測試表明,將SPCE061A應用于語(yǔ)音識別領(lǐng)域,系統性能穩定、聲音質(zhì)量和識別效果較好。但在環(huán)境噪聲或干擾信號高于語(yǔ)音信號時(shí),系統將無(wú)法進(jìn)行正確的語(yǔ)音識別,在背景噪聲處理及其工程實(shí)際上還要進(jìn)一步改進(jìn)。
相關(guān)推薦
技術(shù)專(zhuān)區
- FPGA
- DSP
- MCU
- 示波器
- 步進(jìn)電機
- Zigbee
- LabVIEW
- Arduino
- RFID
- NFC
- STM32
- Protel
- GPS
- MSP430
- Multisim
- 濾波器
- CAN總線(xiàn)
- 開(kāi)關(guān)電源
- 單片機
- PCB
- USB
- ARM
- CPLD
- 連接器
- MEMS
- CMOS
- MIPS
- EMC
- EDA
- ROM
- 陀螺儀
- VHDL
- 比較器
- Verilog
- 穩壓電源
- RAM
- AVR
- 傳感器
- 可控硅
- IGBT
- 嵌入式開(kāi)發(fā)
- 逆變器
- Quartus
- RS-232
- Cyclone
- 電位器
- 電機控制
- 藍牙
- PLC
- PWM
- 汽車(chē)電子
- 轉換器
- 電源管理
- 信號放大器
評論