基于小波變換和自相關(guān)函數的基音頻率檢測算法
0 引言
基音周期(Pitch)是指發(fā)濁音時(shí)聲帶振動(dòng)所引起的周期運動(dòng)的時(shí)間間隔,而基音頻率是基音周期的倒數。由于基音周期只具有準周期性,所有只能采用短時(shí)平均方法估計該周期,這個(gè)過(guò)程也稱(chēng)為基音檢測(Pitch De―tection)。在對說(shuō)話(huà)人確認和辨認研究中,基音頻率是一個(gè)重要的參數,因此準確檢測基音頻率有著(zhù)十分重要的意義。
到目前為止,基音檢測的方法主要有短時(shí)自相關(guān)函數法、平均幅度差函數法、倒譜解卷積法、Hil―be;t―Huang變換法等。但尚未找到一個(gè)完善的可以適用于不同語(yǔ)音狀況和環(huán)境的基音檢測算法。近幾年,小波分析理論發(fā)展迅速。它已經(jīng)被廣泛地應用到信號處理中。這里利用小波變換的濾波特性對信號進(jìn)行預處理,然后利用自相關(guān)函數法檢測語(yǔ)音的基音頻率,該方法利用小波濾波特性有效剔除了高頻共振峰和噪音的影響,估計基音頻率準確性高,穩定性好,運算速度較快。實(shí)驗結果表明,此方法是一種有效的基音頻率檢測算法。
1 小波變換及其濾波特征
在多分辨分析中,塔式正交分解L。(R)空間:
對ν f∈L (R),設f在Vj上的投影系數為Cj,k,在wj上的投影系數為Dj,k(j=J,J一1,…,一J),于是,f有以下分解式:
在式(2)中,第一和式在小波空間中,它表示信號的細節部分(即高頻部分),Dj,k就是對應于小波函數φj,k的小波系數;第二和式在尺度空間中(即低頻部分),它反映了信號的本征部分,C-j,k就是對應于尺度函數φ-j,k的尺度系數。
這里語(yǔ)音信號使用的采樣頻率是11 025 Hz,因此原始語(yǔ)音信號頻帶為0~5 512.5 Hz,如圖1所示,原始語(yǔ)音信號s2d0f占據頻帶為0~5 512.5 Hz,經(jīng)小波濾波器組濾波后,Sd23f占據頻帶0~689 Hz,S爭f就是需要的低頻信號,因為語(yǔ)音基音頻率變化范圍從老年男性的50 Hz到兒童和女性的450 Hz,所以這部分的信號將用于估計語(yǔ)音的基音頻率。
2 自相關(guān)函數估計基音周期
經(jīng)過(guò)小波變換后得到低頻語(yǔ)音信號記為:as,用長(cháng)度為36 ms的矩陣窗對語(yǔ)音信號as進(jìn)行分幀,記第i幀信號為Fi;定義Fi的自相關(guān)函數(ACF)R(k)為:
其中:N是幀Fi的長(cháng)度;k=0,1,…,N一1;mod是取模運算。
自相關(guān)函數在基音頻率的整數倍位置上出現峰值,通過(guò)檢測其峰值的位置就可以提取基音頻率值,通常取第一極大值點(diǎn)為基音頻率點(diǎn)。如圖2所示,圖中顯示某一幀采樣頻率fs=11025 Hz語(yǔ)音信號的自相關(guān)函數曲線(xiàn),曲線(xiàn)的第一個(gè)峰值點(diǎn)x=74,y=4.342,則可以計算出該幀的基音頻率廠(chǎng)fb=fs/74=148.9 Hz。
自相關(guān)函數估計語(yǔ)音基音頻率一般使用矩形窗,窗長(cháng)至少大于2個(gè)基音周期,語(yǔ)音最小基音頻率為60 Hz,即16.7 ms,所以窗長(cháng)使用36 ms是合適的。當單獨使用自相關(guān)函數估計基音頻率時(shí),易受共振峰和噪音的影響,如圖3所示,語(yǔ)音信號在小波變換前的自相關(guān)函數曲線(xiàn)不平滑,給檢測其峰值點(diǎn)造成困難;圖2就是語(yǔ)音信號在小波變換后的自相關(guān)函數曲線(xiàn),曲線(xiàn)平滑,容易檢測其峰值點(diǎn)。
評論