基于A(yíng)TMEGAl28單片機的語(yǔ)音識別系統設計
0 引言
本文引用地址:http://dyxdggzs.com/article/170581.htm傳統的人機交互依靠復雜的鍵盤(pán)或按鈕來(lái)實(shí)現,隨著(zhù)科技的發(fā)展,一些新型的人機交互方式也隨之誕生,帶給人們全新的體驗。基于語(yǔ)音識別的人機交互方式是目前熱門(mén)的技術(shù)之一。但是語(yǔ)音識別功能算法復雜、計算量大,一般在計算機上實(shí)現,即使是嵌入式方面,多數方案也需要運算能力強的ARM或DSP,并且外擴RAM、FLASH等資源,增加了硬件成本,這些特點(diǎn)無(wú)疑限制了語(yǔ)音識別技術(shù)的應用,尤其是嵌入式領(lǐng)域。
本系統采用的主控MCU為Atmel公司的ATMEGA128,語(yǔ)音識別功能則采用ICRoute公司的單芯片LD3320。LD3320內部集成優(yōu)化過(guò)的語(yǔ)音識別算法,無(wú)需外部FLASH,RAM資源,可以很好地完成非特定人的語(yǔ)音識別任務(wù)。
1 整體方案設計
1.1 語(yǔ)音識別原理
在計算機系統中,語(yǔ)音信號本身的不確定性、動(dòng)態(tài)性和連續性是語(yǔ)音識別的難點(diǎn)。主流的語(yǔ)音識別技術(shù)是基于統計模式識別的基本理論,原理如圖1所示。

語(yǔ)音識別通常需要兩個(gè)階段完成。第一階段是訓練,主要是提取語(yǔ)音特征,用戶(hù)往往需要進(jìn)行幾次語(yǔ)音訓練,經(jīng)過(guò)預處理和特征提取后獲得相應特征參數。第二階段是識別,識別過(guò)程就是將輸入的語(yǔ)音特征參數和模型庫中的參數進(jìn)行相似性比較,最后輸出匹配度最高的特征參數完成識別過(guò)程。
2 硬件電路設計
硬件框架如圖2所示,電路主要由主控制器電路和語(yǔ)音識別電路組成。ATMEGA128控制LD3320語(yǔ)音識別電路,輸出結果由ATMEGA128處理,然后通過(guò)總線(xiàn)來(lái)控制不同的設備。

2.1 控制器電路
控制器選用Atmel公司生產(chǎn)的ATMEGA128芯片,采用先進(jìn)的RISC結構,內置128 KB FLASH,4 KB SRAM,4 KB E2PROM等豐富資源。該芯片是業(yè)界高性能、低功耗的8位微處理器,并在8位單片機市場(chǎng)有著(zhù)廣泛應用。
2.2 LD3320語(yǔ)音識別電路
LD3320芯片是一款“語(yǔ)音識別”專(zhuān)用芯片。該芯片集成了語(yǔ)音識別處理器和一些外部電路,包括A/D、D/A轉換器、麥克風(fēng)接口、聲音輸出接口等,而且可以播放MP3。不需要外接任何的輔助芯片如FLASH,RAM等,直接集成到產(chǎn)品中即可以實(shí)現語(yǔ)音識別、聲控、人機對話(huà)功能。
圖3為L(cháng)D3320電路原理圖,與MCU通信采用SPI總線(xiàn)方式,時(shí)鐘不能超過(guò)1.5MHz。

評論