<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 特定人語(yǔ)音識別技術(shù)在汽車(chē)控制上的應用

特定人語(yǔ)音識別技術(shù)在汽車(chē)控制上的應用

——
作者: 時(shí)間:2007-09-28 來(lái)源:PLC&FA 收藏

1  引言

  從20世紀50年代開(kāi)始對的研究開(kāi)始,經(jīng)過(guò)幾十年的發(fā)展已經(jīng)達到一定的高度,有的已經(jīng)從實(shí)驗室走向市場(chǎng),如一些玩具、某些部門(mén)密碼語(yǔ)音輸入等,隨著(zhù)DSP和專(zhuān)用集成電路技術(shù)的發(fā)展,快速傅立葉變換以及近來(lái)嵌入式操作系統的研究,使得特定人識別尤其是計算量小的特定人識別成為可能。因此,對特定人技術(shù)在上的應用的研究是很有前途的。

  2  特定人的方法

  目前,常用的說(shuō)話(huà)人識別方法有模板匹配法、統計建模法、聯(lián)接主義法(即人工神經(jīng)網(wǎng)絡(luò )實(shí)現)??紤]到數據量、實(shí)時(shí)性以及識別率的問(wèn)題,筆者采用基于矢量量化和隱馬爾可夫模型(HMM)相結合的方法。

  說(shuō)話(huà)人識別的系統主要由語(yǔ)音特征矢量提取單元(前端處理)、訓練單元、識別單元和后處理單元組成,其系統構成如圖1所示。

系統構成


  圖1  系統構成

  由上圖也可以看出,每個(gè)司機在購買(mǎi)車(chē)后必須將自己的語(yǔ)音輸入系統,也就是訓練過(guò)程,當然最好是在安靜、次數達到一定的數目。從此在以后駕駛過(guò)程中就可以利用這個(gè)系統了。

  所謂預處理是指對語(yǔ)音信號的特殊處理:預加重,分幀處理。預加重的目的是提升高頻部分,使信號的頻譜變得平坦,以便于進(jìn)行頻譜分析或聲道參數分析。用具有 6dB/倍頻程的提升高頻特性的預加重數字濾波器實(shí)現。雖然語(yǔ)音信號是非平穩時(shí)變的,但是可以認為是局部短時(shí)平穩。故語(yǔ)音信號分析常分段或分幀來(lái)處理。

  2.1  語(yǔ)音特征矢量提取單元

  說(shuō)話(huà)人識別系統設計中的根本問(wèn)題是如何從語(yǔ)音信號中提取表征人的基本特征。即語(yǔ)音特征矢量的提取是整個(gè)說(shuō)話(huà)人識別系統的基礎,對說(shuō)話(huà)人識別的錯誤拒絕率和錯誤接受率有著(zhù)極其重要的影響。同語(yǔ)音識別不同,說(shuō)話(huà)人識別利用的是語(yǔ)音信號中的說(shuō)話(huà)人信息,而不考慮語(yǔ)音中的字詞意思,它強調說(shuō)話(huà)人的個(gè)性。因此,單一的語(yǔ)音特征矢量很難提高識別率。該系統在說(shuō)話(huà)人的識別中采用倒譜系數加基因周期參數,而在對控制命令的語(yǔ)音識別中僅采用倒譜系數。其中,常用的倒譜系數有2 種,即LPC(線(xiàn)性預測系數)和倒譜參數(LPCC),一種是基于Mel刻度的MFLL(頻率倒譜系數)參數(Mel頻率譜系數)。

  對于LPCC參數的提取, 可先采用Durbin遞推算法、格型算法或者Schur遞推算法來(lái)求LPC系數,然后求LPC參數。設第l幀語(yǔ)音的LPC系數為αn,則LPCC的參數為參數1<n≤p

  其中p為L(cháng)PCC系數的階數,k為L(cháng)PCC系數的遞推次數。

  進(jìn)一步的研究發(fā)現,引入一階和二階差分倒譜可以提高識別率。

  對于MPCC參數的提取,若根據Mel曲線(xiàn)將語(yǔ)音信號頻譜分為K個(gè)頻帶,每個(gè)頻帶的能量為θ(Mk),則 MFCC參數為參數 1<n≤p

  通過(guò)對LPCC和MFCC參數對識別率影響的實(shí)驗比較,筆者選取LPCC參數及其一階和二階差分倒譜稀疏作為特征參數。

  基音周期估計的方法很多,主要有基于求短時(shí)自相關(guān)函數的算法、基于求短時(shí)平均幅度差函數(AMDF)的算法、基于同態(tài)信號處理和線(xiàn)性預測編碼的算法。筆者僅介紹基于求短時(shí)自相關(guān)函數的算法。

  設Sw(n)是一段加窗語(yǔ)音信號,它的非零區間為0<n≤n-1。Sw(n)的自相關(guān)函數稱(chēng)為語(yǔ)音信號的S(n)的短時(shí)自相關(guān)函數,用Rw(l)表示,即Rw(l)=參數

  可知短時(shí)自相關(guān)函數在Rw(0)處最大,且在基音周期的各個(gè)整數倍點(diǎn)上有很大的峰值,選擇合適的窗函數(窗長(cháng)為40ms的Hamming窗)與濾波器(帶寬為60~900Hz的帶通濾波器)后,只要找到自相關(guān)函數的第一最大峰值點(diǎn)的位置并計算它與零點(diǎn)的距離,便能估計出基音周期。

  2.2  訓練單元

  訓練單元的功能是把事先收集到的語(yǔ)音利用一定的算法為每一個(gè)待識別的說(shuō)話(huà)人訓練出與之相匹配的參數。針對說(shuō)話(huà)人識別在汽車(chē)應用中的不同的要求,訓練單元也分為2部分:對說(shuō)話(huà)人識別的訓練和對待識別詞的訓練。

  對于說(shuō)話(huà)人識別部分的訓練, 針對說(shuō)話(huà)人的特征進(jìn)行訓練,為每個(gè)合法用戶(hù)建立一套或多套HMM模型,同時(shí)采用基于矢量量化(VQ)的方法,為每個(gè)合法用戶(hù)建立VQ碼本。VQ碼本的設計采用LBG算法,初始碼本的設置采用分裂法初始碼本。

  第2 部分針對控制命令中用到的每個(gè)孤立的詞條建立多個(gè)訓練樣本,或稱(chēng)為詞條樣本,估計出該詞條的HMM參數(一套或多套)。對一個(gè)HMM過(guò)程的完整的描述包括:2個(gè)模型參數N和M,3組概率度量A,B和π。為了方便起見(jiàn),通常采用如下方式表示一個(gè)完整的模型:λ=(N,M,π,A,B),或者簡(jiǎn)寫(xiě)為:λ= (π,A,B)。而對于每一個(gè)詞條V的模型參數,V=1~V,可以用Baum-Welch重估算法。

  2.3  識別單元

  識別單元的功能是利用經(jīng)訓練已經(jīng)獲得的HMM模型參數 和測得的說(shuō)話(huà)人的基音周期在一定的判決條件下辨認出待識別的說(shuō)話(huà)人并估計出待識別的控制命令詞串。針對HMM模型參數通常采用的判決條件是最大后驗概率,用Viterbi算法實(shí)現。

  2.4  后處理單元

  充分利用每個(gè)說(shuō)話(huà)人的聲道參數和詞條中各狀態(tài)持續時(shí)間的概率分布來(lái)改進(jìn)系統的識別率。

  3  系統的實(shí)現

  由于汽車(chē)的控制命令是有限的詞條和數字串的組合, 對這些語(yǔ)音命令的識別屬于特定人小詞匯量的連接詞的識別以及與文本有關(guān)的說(shuō)話(huà)人確認,不論是從目前的DSP運算速度還是存儲空間來(lái)說(shuō),實(shí)時(shí)實(shí)現這些語(yǔ)音命令的識別都是完全可能的。

  識別系統組成框圖如圖所示:在此系統中,對運算能力和存儲單元要求非常高的語(yǔ)音識別部分完全由DSP完成。

   識別系統的組成框圖

圖2     識別系統的組成框圖

  框圖中識別系統的功能是完成語(yǔ)音的輸入、A/D轉換及識別,系統中核心部分采用TMS320VC5410。其原因是它的運算速度和存儲空間都能滿(mǎn)足要求,同時(shí)它的一些并行運算硬件結構也非常適合語(yǔ)音識別的各種算法,程序和已經(jīng)脫機訓練好的HMM參數表及相應的詞典存放在程序存儲器中,數據存儲器存放識別過(guò)程中的中間計算數據。A/D芯片采用TLC320AD50C, 里面含有A/D、D/A以及低通濾波器和采樣保持電路。模擬語(yǔ)音信號的輸入主要是通過(guò)傳聲器,保證語(yǔ)音門(mén)禁的安全性,轉換后的數字語(yǔ)音數據以同步串行通信方式傳送給DSP。如圖2。

  4  結束語(yǔ)

  語(yǔ)音控制汽車(chē)是未來(lái)的一種趨勢。目前,將語(yǔ)音技術(shù)應用于汽車(chē)的產(chǎn)品只有在一些玩具中用到,由此可想利用語(yǔ)音技術(shù)進(jìn)行這一領(lǐng)域蘊涵著(zhù)相當大的潛在市場(chǎng)。

  而且,說(shuō)話(huà)人識別技術(shù)已經(jīng)發(fā)展到可以應用到實(shí)際的階段了,但目前對說(shuō)話(huà)人識別的應用并不是很多。筆者嘗試提出一種比較容易實(shí)現的方案,將說(shuō)話(huà)人識別技術(shù)應用到實(shí)際中。但在實(shí)際應用中,說(shuō)話(huà)人識別系統都面臨一個(gè)共同的問(wèn)題,即無(wú)法區分一個(gè)發(fā)音是現場(chǎng)發(fā)音還是錄音回放。針對該現象,筆者提出的說(shuō)話(huà)人識別系統可以有效地防止這種情況發(fā)生。具體實(shí)現說(shuō)話(huà)人識別系統時(shí),可采用隨機或其它方法來(lái)生成提示文本。如隨機的數字串,以使假冒者無(wú)法事先錄音,增加駕駛的安全性。 



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>