<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 消費電子 > 設計應用 > 一款語(yǔ)音口令識別系統的設計實(shí)現

一款語(yǔ)音口令識別系統的設計實(shí)現

作者: 時(shí)間:2014-03-17 來(lái)源:網(wǎng)絡(luò ) 收藏

引言

本文引用地址:http://dyxdggzs.com/article/234840.htm

隨著(zhù)計算機技術(shù)和信息技術(shù)的迅速發(fā)展,語(yǔ)音口令識別已經(jīng)成為了人機交互的一個(gè)重要方式之一。語(yǔ)音口令識別系統將根據人發(fā)出的聲音、音節或短語(yǔ)給出響應,如通過(guò)語(yǔ)音口令控制一些執行機構、控制家用電器的運行或做出回答等。在數字信號處理芯片上已經(jīng)實(shí)現了語(yǔ)音口令識別系統或語(yǔ)音口令識別系統的部分功能,然而隨著(zhù)嵌入式微處理器處理能力的大幅度提高,計算量大的語(yǔ)音口令識別算法已經(jīng)能夠通過(guò)嵌入式微處理器來(lái)完成,將語(yǔ)音口令識別系統與相結合,發(fā)揮系統的潛力,使系統能夠廣泛應用于便攜式設備中。

采用隱馬爾克夫模型(Hidden Markov MODEL,HMM) 描述語(yǔ)音信號的非平穩性和局部平穩性,HMM中的狀態(tài)與語(yǔ)音信號的某個(gè)平穩段相對應,平穩段之間以轉移概率相聯(lián)系。由于HMM建模對語(yǔ)音信號長(cháng)度和模型的混合度的要求都比較低,因此在現有的非特定人語(yǔ)音口令識別系統中,多采用狀態(tài)輸出具有連續概率分布的連續隱馬爾可夫模型(ConTInuous Density Hidden Markov MODEL,CDHMM)。

論文給出一種基于的語(yǔ)音口令識別系統的設計方案,硬件系統的核心芯片是嵌入式微處理器,語(yǔ)音口令識別算法采用CDHMM。語(yǔ)音口令首先經(jīng)過(guò)預處理,提取MFCC(Mel-Frequency Ceptral Coefficients)特征參數,然后建立此口令的CDHMM模型,把所有語(yǔ)音口令的模型放在模型庫中,在識別階段,通過(guò)概率輸出*分,取*分最大的一個(gè)作為識別出的口令。將系統與相結合,可以使語(yǔ)音口令識別系統廣泛應用于便攜式設備中。

1 硬件電路的設計和工作原理

基于嵌入式系統的語(yǔ)音口令識別系統需要有接收語(yǔ)音信號的輸入芯片配合麥克風(fēng)實(shí)現將模擬語(yǔ)音信號轉換成數字信號的功能,然后由嵌入式微處理器對輸入的語(yǔ)音口令信號進(jìn)行處理。完成語(yǔ)音口令信號輸入功能的芯片采用的是PHILIPS公司的低功耗芯片UDAl341TS,供電電源電壓為3V,該音頻處理芯片由模數/數模轉換(ADC)、控制邏輯電路、可編程增益放大器(PGA)和數字自動(dòng)增益控制器(DAGC)以及數字信號處理器等部分組成,能進(jìn)行數字語(yǔ)音處理。

芯片UDAl341TS采用標準的內部集成電路聲音總線(xiàn)IIS(Inter IC Sound Bus),該總線(xiàn)是由PHILIPS等公司共同提出的數字音頻總線(xiàn)協(xié)議,專(zhuān)門(mén)用于音頻設備之間的數據傳輸,目前很多音頻芯片和微處理器都提供了對IIS總線(xiàn)的支持。

IIS總線(xiàn)有三根信號線(xiàn),分別是位時(shí)鐘信號BCK(Bit Clock)、字選擇控制信號WS(Word Select)和串行數據信號Data,由主設備提供串行時(shí)鐘信號和字選擇控制信號,IIS總線(xiàn)的時(shí)序如圖1所示。

?

?

WS也稱(chēng)為幀時(shí)鐘信號,該信號的電平為低電平時(shí),傳輸的輸入音頻數據信號是左聲道的音頻數據信號;信號WS的電平為高電平時(shí),傳輸的輸入音頻數據信號是右聲道的音頻數據信號。BCK對應著(zhù)輸入音頻數據信號的每一位音頻數據,其頻率為2×采樣頻率×每個(gè)采樣值的位數。

與BCK同步的串行音頻數據信號采用補碼的形式傳輸,傳輸順序是高位先傳輸。IIS總線(xiàn)格式的信號無(wú)論有多少位有效數據,數據的最高位MSB總是出現在WS信號改變(也就是傳輸一幀數據信號開(kāi)始)后的第2個(gè)串行數據信號SCLK脈沖位置。

通過(guò)上述IIS總線(xiàn)能夠得到輸入的音頻數據信號,而其它的信號如自動(dòng)增益控制、輸入數據格式的選擇和輸入增益的控制等控制信號通過(guò)稱(chēng)為“L3” 形式的接口總線(xiàn)傳輸。為了減少引腳數和保持連線(xiàn)簡(jiǎn)單,該接口總線(xiàn)采用串行數據傳輸方式,接口總線(xiàn)由3條信號線(xiàn)組成:時(shí)分復用的數據通道線(xiàn)L3DATA、模式控制線(xiàn)L3MODE和時(shí)鐘信號線(xiàn)L3CLOCK。模式控制線(xiàn)L3MODE為低電平時(shí)的傳輸模式為地址傳輸模式;為高電平時(shí)的傳輸模式為數據傳輸模式。

語(yǔ)音口令識別系統的硬件電路的核心芯片是嵌入式微處理器Samsung S3C2440 AL,主頻為400MHz。三星公司推出的RISC微處理器S3C2440 AL具有低功耗、高性能等特點(diǎn),可以廣泛應用于便攜式設備中。

S3C2440AL具有一個(gè)IIS總線(xiàn)音頻編碼/解碼接口,語(yǔ)音口令識別系統的硬件電路如圖 2所示。其IIS總線(xiàn)控制器通過(guò)5根信號線(xiàn)與UDAl34lTS編解碼芯片相連。這些5根信號線(xiàn)分別是:系統時(shí)鐘信號CDCLK:位時(shí)鐘信號I2- SSCLK;字選擇控制信號I2SLRCK;串行數據輸入信號I2SSDI;串行數據輸出信號I2SDO。S3C2440 AL使用L3接口傳輸其他(如自動(dòng)增益控制、輸入數據格式的選擇和輸入增益的控制等)控制信號。為了使系統間能夠更好地同步,S3C2440AL需要向芯片UDAl341TS提供CDCLK,該時(shí)鐘信號的頻率可以選擇采樣頻率的256倍、384倍或512倍。

?

?

2 基于CDHMM的口令識別的軟件設計

2.1 口令識別的軟件系統框圖

語(yǔ)音口令識別的軟件系統分別由特征參數提取、語(yǔ)音模型庫和概率輸出*分三大模塊組成,如圖3所示:1)語(yǔ)音口令特征參數的提取,輸入不同的語(yǔ)音口令,首先要進(jìn)行特征參數提取,采用Mel頻率參數作為CDHMM的建模參數,Mel頻率參數是根據人耳的聽(tīng)覺(jué)特性將語(yǔ)音信號的頻譜轉化為基于Mel頻率的非線(xiàn)性頻譜,然后轉換到倒譜域上。2)在訓練階段,對不同的語(yǔ)音口令建立CDHMM模型。3)在口令識別階段,通過(guò)概率輸出*分對待測語(yǔ)音口令做出識別。

?

?

語(yǔ)音口令首先經(jīng)過(guò)預處理,提取MFCC特征參數,然后建立此口令的CDHMM模型,把所有語(yǔ)音口令的模型放在模型庫中,在識別階段,通過(guò)概率輸出*分,取*分最大的一個(gè)作為識別出的口令。

2.2 CDHMM算法

HMM是一種雙重隨機過(guò)程,用概率統計的方法描述語(yǔ)音信號的產(chǎn)生及變化過(guò)程。HMM的模型參數為λ=(N,M,π,A,B),其中,N為模型中馬爾克夫鏈的狀態(tài)數目;M為每個(gè)狀態(tài)對應的可能的觀(guān)察數目;π為初始狀態(tài)概率矢量,π=(π1,…,πN);A為狀態(tài)轉移矩陣,A=(aij)N*N;B 為觀(guān)察概率矩陣,B=(bjk)N*N。


上一頁(yè) 1 2 下一頁(yè)

關(guān)鍵詞: 語(yǔ)音識別 嵌入式系統

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>