<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 汽車(chē)電子 > 設計應用 > 基于DSP的高速實(shí)時(shí)語(yǔ)音識別系統的設計與實(shí)現

基于DSP的高速實(shí)時(shí)語(yǔ)音識別系統的設計與實(shí)現

——
作者: 時(shí)間:2007-10-26 來(lái)源: 收藏

  實(shí)時(shí)系統中,由于語(yǔ)音的數據量大,運算復雜,對處理器性能提出了很高的要求,適于采用高速實(shí)現。雖然提供了高速和靈活的硬件設計,但是在實(shí)時(shí)處理系統中,還需結合器件的結構及工作方式,針對語(yǔ)音處理的特點(diǎn),對軟件進(jìn)行反復優(yōu)化,以縮短識別時(shí)間,滿(mǎn)足實(shí)時(shí)的需求。因此如何對DSP進(jìn)行優(yōu)化編程,解決算法的復雜性和硬件存儲容量及速度之間的矛盾,成為實(shí)現系統性能的關(guān)鍵。本文基于設計并實(shí)現了高速實(shí)時(shí)系統,在固定文本的說(shuō)話(huà)人辨識的應用中效果顯著(zhù)。

  1 的原理

  語(yǔ)音識別的基本原理框圖如圖1所示。語(yǔ)音信號中含有豐富的信息,從中提取對語(yǔ)音識別有用的信息的過(guò)程,就是特征提取,特征提取方法是整個(gè)語(yǔ)音識別系統的基礎。語(yǔ)音識別的過(guò)程可以被看作足模式匹配的過(guò)程,模式匹配是指根據一定的準則,使未知模式與模型庫中的某一模型獲得最佳匹配。

  

  1.1 MFCC

  語(yǔ)音識別中對特征參數的要求是:

  (1) 能夠有效地代表語(yǔ)音特征;

  (2) 各階參數之間有良好的獨立性;

  (3) 特征參數要計算方便,保證識別的實(shí)時(shí)實(shí)現。

  系統使用目前最為常用的MFCC(Mel FrequencyCepstral Coefficient,美爾頻率倒譜系數)參數。

  求取MFCC的主要步驟是:

  (1) 給每一幀語(yǔ)音加窗做FFT,取出幅度;

  (2) 將幅度和濾波器組中每一個(gè)三角濾波器進(jìn)行Binning運算;

  (3) 求log,換算成對數率;

  (4) 從對數率的濾波器組幅度,使用DCT變換求出MFCC系數。

  

  本文中采用12階的MFCC,同時(shí)加過(guò)零率和delta能量共14維的語(yǔ)音參數。

  1.2 DTW

  語(yǔ)音識別中的模式匹配和模型訓練技術(shù)主要有DTW(Dynamic Time Warping,動(dòng)態(tài)時(shí)間彎折)、HMM(HideMarkov Model,隱馬爾科夫模型)和ANN(Artificial Neu-ral Network,人工神經(jīng)元網(wǎng)絡(luò ))。

  DTW是一種簡(jiǎn)單有效的方法。該算法基于動(dòng)態(tài)規劃的思想,解決了發(fā)音長(cháng)短不一的模板匹配問(wèn)題,是語(yǔ)音識別中出現較早、較為經(jīng)典的一種算法。DTW算法的原理是計算兩個(gè)長(cháng)度不同的語(yǔ)音之間的相似程度,即失真距離。

  設測試語(yǔ)音和參考語(yǔ)音用T和R表示,他們分別含有N幀和M幀的語(yǔ)音參數。本文中每幀語(yǔ)音的特征參數為14維,因此T,R分別為N



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>