<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 基于凌陽(yáng)單片機的通用型語(yǔ)音控制系統

基于凌陽(yáng)單片機的通用型語(yǔ)音控制系統

作者: 時(shí)間:2011-02-12 來(lái)源:網(wǎng)絡(luò ) 收藏


2 語(yǔ)音播放模塊設計
語(yǔ)音處理大致可以分為A/D、編碼處理、存儲、解碼處理以及D/A等。然而,麥克風(fēng)輸入所生成的WAVE文件,其占用的存儲空間很大,對于單片機來(lái)說(shuō)想要存儲大量的信息顯然是不可能的,而凌陽(yáng)SPCE061A提出了解決的方法,即SACM-LIB,該庫可將A/D、編碼、解碼、存儲及D/A做成相應的模塊,對應的每個(gè)模塊都有其應用程序接口A(yíng)PI,所以只需了解每個(gè)模塊所要實(shí)現的功能及其參數的內容,然后調用該API函數即可實(shí)現該功能。

3 語(yǔ)音識別模塊設計
3.1 語(yǔ)音識別原理

語(yǔ)音識別系統包括學(xué)習訓練過(guò)程和識別過(guò)程2大部分,基本原理如圖3所示。

本文引用地址:http://dyxdggzs.com/article/172990.htm


(1)預處理。包括預加重、加窗分幀、端點(diǎn)檢測等處理過(guò)程,在預處理之前還有語(yǔ)音信號的數字化處理過(guò)程。其中,包括反混疊濾波、模/數轉換自動(dòng)增益等用以去除聲門(mén)激勵、口鼻輻射、高于1/2采樣率的高頻信號和噪聲信號的影響,以實(shí)現語(yǔ)音信號的數字化。
(2)聲學(xué)特征分析提取。經(jīng)過(guò)預處理后的語(yǔ)音信號,要對其進(jìn)行特征提取,即特征參數分析。該過(guò)程就是從原始語(yǔ)音信號中抽取能夠反映語(yǔ)音本質(zhì)的特征參數,以形成特征矢量序列。目前語(yǔ)音識別所用的特征參數主要有2種類(lèi)型:線(xiàn)性預測倒譜系數(LPCC)和美爾頻標倒譜系數(MFCC)。LPCC系數主要是模擬人的發(fā)聲模型,未考慮人耳的聽(tīng)覺(jué)特性。MFCC系數考慮到了人的聽(tīng)覺(jué)特性,但要計算傅里葉變換將耗費大量寶貴的計算資源。因此,在嵌入式語(yǔ)音識別系統中一般都選用LPCC系數。語(yǔ)音特征提取是分幀提取的,每幀特征參數一般構成一個(gè)矢量。為此,有必要采用很有效的數據壓縮技術(shù)方法對數據進(jìn)行壓縮。
(3)參考模板。參考模版時(shí)將一個(gè)或多個(gè)說(shuō)話(huà)者多次重復的語(yǔ)音參數經(jīng)過(guò)訓練得到,它是聲學(xué)參數模版,在系統識別使用前獲得并存儲起來(lái)。
(4)判定識別。模式識別是將輸入的待識別語(yǔ)音特征參數與訓練得到的參考語(yǔ)音模式進(jìn)行逐一比較分析,獲得的最佳匹配參考模式便為識別結果。目前常用的語(yǔ)音識別算法主要有動(dòng)態(tài)時(shí)間規則、離散隱馬爾可夫模型、連續隱馬爾可夫模型及人工神經(jīng)網(wǎng)。
3.2 語(yǔ)音識別系統原理和算法
在SPCE061A內置的8通道10位模/數轉換器(analog to digital converter,ADC)中專(zhuān)門(mén)設置了一個(gè)只用于語(yǔ)音輸入的通道MIC_IN,針對較弱信號的轉換還設計了一個(gè)音頻放大器(automation gain control,AGC)。對其自動(dòng)增益控制放大后再進(jìn)行A/D轉換。實(shí)際上,可以把模/數轉換器看作是一個(gè)實(shí)現模/數信號轉換的編碼器。ADC轉換的原理是依次把設定在逐次逼近寄存器SAR中的數字送至10位DAC0中進(jìn)行D/
A轉換。DAC0的電壓模擬量輸出值與外部的電壓模擬量輸入值進(jìn)行比較,以便盡快找出外部電壓模擬量的數字量輸出,其輸出的模擬量VDAC0與采樣后的輸入電壓值VIN相比較時(shí)可采用對半搜索法,即從SAR中最高有效位開(kāi)始,根據比較的大小逐位確定其數碼取“1”,其余位為“ 0”。語(yǔ)音識別算法的原理是:在訓練過(guò)程中,從每個(gè)說(shuō)話(huà)人發(fā)出的訓練語(yǔ)句中提取相應的能充分描述各個(gè)說(shuō)話(huà)人行為的特征矢量,這些特征矢量稱(chēng)為各說(shuō)話(huà)人的模板。在測試階段,從說(shuō)話(huà)人發(fā)出的語(yǔ)音信號中按同樣的處理方法提取測試模板,并與相應的參考模板相比較。由于說(shuō)話(huà)人每次發(fā)音是變化的,測試模板和參考模板在時(shí)間尺度上不可能完全一致。為了使二者能在時(shí)間等效點(diǎn)上加以比較,采用了動(dòng)態(tài)時(shí)間規整
法(DTW)?;驹硎窃趨⒖紭颖咎卣魇噶啃蛄蠥=[a1,a2,…,aM]與待識語(yǔ)音特征矢量序列B=[b1,b2,…,bN]之間用一種非線(xiàn)性規整技術(shù)實(shí)現匹配。從目前來(lái)看,基于動(dòng)態(tài)時(shí)間規整匹配的DTW算法可能是一個(gè)最為小巧的語(yǔ)音識別算法,系統開(kāi)銷(xiāo)小,識別速度快,在小詞匯量的語(yǔ)音命令控制系統中是一個(gè)非常有效的算法。在訓練階段,用戶(hù)將詞匯表中的詞依次說(shuō)一遍,提取出每一幀采樣數據的特征向量,并將特征向量作為模板存入模板庫中。在識別階段,提取待識語(yǔ)音的特征向量,然后將其依次與模板庫中的每一個(gè)模板進(jìn)行相似度比較,并將相似度最高者作為結果輸出。



關(guān)鍵詞: 凌陽(yáng)單片機

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>