線(xiàn)性預測及其Matlab實(shí)現
線(xiàn)性預測分析是現代語(yǔ)音信號處理中最核心的技術(shù)之一,為現代語(yǔ)音信號處理的飛速發(fā)展立下了赫赫功勞,在語(yǔ)音分析、合成、編碼、識別等方面都有著(zhù)廣泛的應用,至今仍是最有效的語(yǔ)音分析技術(shù)之一。如VoIP和H.323網(wǎng)上多媒體通信系統中所使用的G.729 CS-ACELP語(yǔ)音編碼算法就是一種以共軛代數碼本激勵線(xiàn)性預測為基礎的高質(zhì)量的語(yǔ)音編碼標準。
1線(xiàn)性預測的基本原理
在語(yǔ)音信號處理中最常用的模型是全極點(diǎn)模型。線(xiàn)性預測所包含的基本概念是,通過(guò)使實(shí)際語(yǔ)音抽樣和線(xiàn)性預測抽樣之間差值的平方和達到最小值,即進(jìn)行最小均方誤差的逼近,能夠決定惟一的一組預測器系數。如果一個(gè)隨機過(guò)程用一個(gè)p階全極點(diǎn)系統受白噪聲激勵產(chǎn)生的輸出來(lái)模擬,設這個(gè)系統的傳遞函數為:
其中:p是預測器階數;G是聲道濾波器增益。由此,語(yǔ)音抽樣s(n)和激勵信號e(n)之間的關(guān)系可用下列差分方程來(lái)表示:
即語(yǔ)音樣點(diǎn)間有相關(guān)性,可以用過(guò)去的樣點(diǎn)值預測未來(lái)樣點(diǎn)值。對于濁音,激勵e(n)是以基音周期重復的單位沖激;對于清音e(n)是平穩白噪聲。
在模型參數估計過(guò)程中,把如下系統稱(chēng)為線(xiàn)性預測器:
式中:ai稱(chēng)為線(xiàn)性預測系數。從而,p階線(xiàn)性預測器的系統函數具有如下形式:
在式(1)中的A(z)稱(chēng)作逆濾波器,基傳輸函數為:
而線(xiàn)性預測方程可以按如下方法得到:把某一幀內的短時(shí)平均預測誤差定義為:
由此可計算出預測系數。
由于語(yǔ)音信號的短時(shí)平穩性,要分幀處理(10~30 ms),對于一幀從n時(shí)刻開(kāi)窗選取的N個(gè)樣點(diǎn)的語(yǔ)音段s(n),記為Φn(j,i):
2 G.729中線(xiàn)性預測分析的基本原理
用10階線(xiàn)性預測(LP)作短時(shí)分析,LP合成濾波器定義為:
評論