IP網(wǎng)絡(luò )電話(huà)中常用的語(yǔ)音壓縮編碼技術(shù)的性能分析

作者：時(shí)間：2006-05-07 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

摘要：從語(yǔ)音編碼技術(shù)中常用的三種編碼方法入手，由淺入深地引出了IP網(wǎng)絡(luò )電話(huà)中常用的幾種語(yǔ)音壓縮編碼方法，并對之進(jìn)行了性能分析和比較。

本文引用地址：http://dyxdggzs.com/article/242387.htm

關(guān)鍵詞：IP網(wǎng)絡(luò )電話(huà) 語(yǔ)音壓縮編碼線(xiàn)性預測（LP）合成-分析法

隨著(zhù)互聯(lián)網(wǎng)的迅速發(fā)展，最近幾年出現了一種在互聯(lián)網(wǎng)上提供電話(huà)服務(wù)的新業(yè)務(wù)——IP電話(huà)業(yè)務(wù)。一次IP電話(huà)呼叫的成本為本地市話(huà)費、IP網(wǎng)絡(luò )使用費以及遠端市話(huà)費，與傳統長(cháng)途電話(huà)昂貴的長(cháng)途通信費相比，可以極大地降低用戶(hù)的通信費用。正是由于這種極大的價(jià)格優(yōu)勢，使得它一出現便引起了世人充分的注意，同時(shí)互聯(lián)網(wǎng)的蓬勃發(fā)展，有效地利用現有的網(wǎng)絡(luò )資源，來(lái)緩解現有通信網(wǎng)的緊張局面，也是促成這項新技術(shù)迅速發(fā)展的另一原因。從另一個(gè)角度來(lái)看，互聯(lián)網(wǎng)的巨大成功，必將使IP成為未來(lái)信息網(wǎng)絡(luò )的支柱技術(shù)，以IP為核心的分組化和以移動(dòng)通信為核心的無(wú)線(xiàn)化已成為電信網(wǎng)絡(luò )演進(jìn)的主流方向。其于TCP/IP的網(wǎng)絡(luò )技術(shù)不但無(wú)可置疑地成為數據領(lǐng)域的主導技術(shù)，而且已經(jīng)開(kāi)始進(jìn)入電信領(lǐng)域，其突破口就是電話(huà)業(yè)務(wù)。IP網(wǎng)絡(luò )電話(huà)的成功開(kāi)發(fā)和應用，預示了以IP為基礎的新一代信息網(wǎng)絡(luò )的出現。積極地探索和跟蹤這項新技術(shù)無(wú)疑是一項十分有必要和有意義的工作。

IP網(wǎng)絡(luò )電話(huà)是一項涉及計算機網(wǎng)絡(luò )、信令協(xié)議、數字信號處理等多個(gè)領(lǐng)域的綜合性技術(shù)，它具有價(jià)格低廉、可以靈活地提供各種增值業(yè)務(wù)、有利于企業(yè)建立高效綜合服務(wù)內部網(wǎng)、有利于運營(yíng)商開(kāi)拓新的市場(chǎng)、有助于和IP網(wǎng)絡(luò )新技術(shù)的融合、促進(jìn)網(wǎng)絡(luò )技術(shù)的發(fā)展等獨特的優(yōu)勢。其中價(jià)格低廉是IP電話(huà)能夠進(jìn)入市場(chǎng)的首要因素，其根本原因是IP電話(huà)均采用語(yǔ)音分組技術(shù)、語(yǔ)音壓縮編碼和統計復用，帶寬利用率高，完成一次通信所需的成本大幅度降低。IP網(wǎng)絡(luò )電話(huà)中的語(yǔ)音處理主要需要解決兩個(gè)問(wèn)題，一是在保證一定話(huà)音質(zhì)量的前提下盡可能地降低編碼比特率，二是在IP網(wǎng)絡(luò )環(huán)境下保證一定的通話(huà)質(zhì)量。前者正是我們剛剛提到的語(yǔ)音編碼技術(shù)。

1 語(yǔ)音編碼技術(shù)的分類(lèi)

語(yǔ)音處理的研究是和通信技術(shù)的發(fā)展服密切相關(guān)的。人們?yōu)樘岣咄ㄐ畔到y的效率而研究語(yǔ)音編碼方法，為滿(mǎn)足低碼率的通信要求，而研究語(yǔ)音分析合成系統——聲碼器。研究語(yǔ)音編碼就是要解決傳輸速率和語(yǔ)音質(zhì)量的矛盾。最早的標準化語(yǔ)音編碼系統是速率為64kb/s的PCM波形編碼器。到二十世紀90年代中期，速率為4ks/s～8kb/s的波形與參數混合編碼器，在語(yǔ)音質(zhì)量上已逼近前者的水平且已達到實(shí)用化階段。根據語(yǔ)音編碼的發(fā)展過(guò)程，我們把該技術(shù)歸納為以下三類(lèi)：

（1）波形編碼（或稱(chēng)為非參數編碼）

波形編碼方式是能夠忠實(shí)地表現波形的編碼方式。語(yǔ)音信號的波形編碼力圖使重建的語(yǔ)音波形保持原語(yǔ)音信號的波形狀態(tài)。這類(lèi)編碼器通常是將語(yǔ)音信號作為一般的波形信號來(lái)處理，比如：脈沖編碼調制（PCM）、自適應增量調制（ADM或ΔM編碼）、自適應差分編碼（ADPCM）、自適應預測編碼（APC）、自適應子帶編碼（ASBC）、自適應變換編碼（ATC）等都屬于這類(lèi)編碼器。以上幾種波形編碼方式分別在64kb/s～16kb/s的速率上能給出高的編碼質(zhì)量。當速率進(jìn)一步降低時(shí)，其性能會(huì )下降較快。由于這類(lèi)編碼器通常將語(yǔ)音信號作為一般的波形信號來(lái)處理，所以它具有適應能力強、話(huà)音質(zhì)量好、抗噪抗誤碼的能力強等特點(diǎn)，但所需的編碼速率高，其中64kb/s PCM的語(yǔ)音質(zhì)量成為一個(gè)編碼質(zhì)量的參照標準。

（2）參數編碼（或稱(chēng)為模型編碼或聲碼化編碼）

參數編碼是根據聲音的形成模型，把聲音變換成參數的編碼方式。其基本方法是通過(guò)對語(yǔ)音信號特征參數的提取及編碼，力圖使重建語(yǔ)音信號具有盡可能的可懂性，即保持原語(yǔ)音的語(yǔ)義。而重建的信號的波形同原語(yǔ)音信號的波形可能會(huì )有相當大的差別。參數編碼的典型例子語(yǔ)音信號的線(xiàn)性預測編碼（LPC）已被公認為是目前參數編碼中最有效的方法，它能夠在2.4kb/s的低比特速率下獲得清晰、可懂的合成音。并且易于硬件實(shí)現。這種方法的優(yōu)點(diǎn)是不但能極為精確地估計參數，還在于它的計算速度比較快。另外多帶激勵（MBE）編碼，余弦變換編碼（STC）均屬參數編碼。

由于參數編碼是保護語(yǔ)聲模型，重建清晰可識別的語(yǔ)聲，而不注重波形的擬合，所以這類(lèi)編碼技術(shù)實(shí)現的是合成語(yǔ)聲質(zhì)量下的低速或極低速的編碼。參數編碼的優(yōu)點(diǎn)是：編碼速率低，編碼速率通常小于4.8kb/s，可以低至600b/s至2.4kb/s。缺點(diǎn)是：合成語(yǔ)音質(zhì)量差，特別是自然度較低，連熟人之間都不一定能聽(tīng)出講話(huà)人是誰(shuí)；另外，這類(lèi)編碼器對講話(huà)環(huán)境噪聲較敏感，需要安靜的講話(huà)環(huán)境才能給出較高的可懂度，且時(shí)延大。

（3）混合編碼

混合編碼是將波形編碼與參數編碼結合而產(chǎn)生的一種編碼方式。使語(yǔ)音編碼技術(shù)有了突破性的進(jìn)展。其中提出了一些非常有效的處理方法，產(chǎn)生了新一代的參數編碼算法，構成了新一代的聲碼器。

混合編碼結合了以上兩種編碼方式的優(yōu)點(diǎn)，采用線(xiàn)性技術(shù)構成聲道模型，不只傳輸預測參數和清濁音信息，而是將預測誤差信息和預測參數同時(shí)傳輸，在接收端構成新的激勵激去激勵預測參數構成的合成濾波器，使得合成濾波器輸出的信號波形與原始語(yǔ)聲信號的波形最大程序的擬合，從而獲得自然度較高的語(yǔ)聲。這種編碼技術(shù)的關(guān)鍵是：如何高效地傳輸預測誤差信息。依據對激勵信息的不同處理，這類(lèi)編碼主要有：多脈沖線(xiàn)性預測編碼（MPLPC）、規則脈沖激勵線(xiàn)性預測編碼（RPELPC）、碼激勵線(xiàn)性預測編碼（CELPC）、低時(shí)延的碼激勵線(xiàn)性預測編碼（LD-CELPC）。

混合編碼克服了原有波形編碼器與聲碼器的弱點(diǎn)，而結合了它們的優(yōu)點(diǎn)，在4～16kb/s速率上能夠得到高質(zhì)量合成語(yǔ)音。在本質(zhì)上具有波形編碼的優(yōu)點(diǎn)，有一定抗噪和抗誤碼的性能，但時(shí)延較大。

2 語(yǔ)音壓縮編碼的原理

IP網(wǎng)絡(luò )電話(huà)中的語(yǔ)音處理需要解決的兩個(gè)問(wèn)題之一是在保證一定話(huà)音質(zhì)量的前提下，盡可能降低編碼比特率。這主要依靠語(yǔ)音編碼技術(shù)來(lái)解決。IP網(wǎng)絡(luò )電話(huà)宜使用ITU-T定義的低比特率編碼標準，其比特率為5.3～16kbit/s，均為低復雜度編碼算法，話(huà)音分組長(cháng)度在30ms以下，話(huà)音質(zhì)量較好。從前面列舉的幾種編碼方式也可看出，同一段語(yǔ)音信號，采用不同的編碼方式，其編碼后的比特率各不相同。那么為什么我們能夠對語(yǔ)音信號進(jìn)行壓縮編碼從而達到降低語(yǔ)音信號的比特率呢？

（1）利用了語(yǔ)音信號的相關(guān)性

語(yǔ)音信源是相關(guān)信源，因此經(jīng)過(guò)采樣和量化的信號之間還有很強的相關(guān)性，為了降低編碼速率，人們就希望盡可能多地去除語(yǔ)音信號之間的相關(guān)性。線(xiàn)性預測編碼技術(shù)（LPC）就是一種用來(lái)去除語(yǔ)音信號之間相關(guān)性的常用技術(shù)。語(yǔ)音信號中存在兩種類(lèi)型的相關(guān)性：其一是在樣點(diǎn)之間短時(shí)相關(guān)性。語(yǔ)音信號在某些短時(shí)段中呈現出隨機噪聲的特性，在另一些短時(shí)段中，則呈現出周期信號的特性，其它一些是二者的混合。簡(jiǎn)而言之，語(yǔ)音信號的特征是隨時(shí)間而變化的，只是在一短段時(shí)間中，語(yǔ)音信號才保持相對穩定一致的特征，也就是語(yǔ)音信號的短時(shí)平穩性。其二是相鄰基音周期之間存在的長(cháng)時(shí)相關(guān)性。由于語(yǔ)音信號中的短時(shí)相關(guān)性和長(cháng)時(shí)相關(guān)性很強，通過(guò)減弱這些相關(guān)性，使語(yǔ)音信號之間相關(guān)性降低，然后再進(jìn)行編碼，這樣就可以實(shí)現語(yǔ)音壓縮編碼，降低比特率。例如差分脈沖編碼（DPCM）就是利用了語(yǔ)音信號的相關(guān)性來(lái)降低比特率的。所謂語(yǔ)音信號的相關(guān)性，就是相鄰樣點(diǎn)之差很小，其包含的信息量遠小于抽樣值本身，對差值編碼而不是對抽樣值本身進(jìn)行編碼，這樣所需的比特率必然下降，這就是DPCM能夠降低比特率的原因。

（2）利用了人耳的聽(tīng)覺(jué)特性

利用人耳的掩蔽效應也可以進(jìn)行語(yǔ)音壓縮編碼，降低比特率。兩個(gè)響度不等的聲音作用于人耳時(shí)，則響度較高的頻率成份的存在會(huì )影響到對響度較低的頻率成份的感覺(jué)，使其變得不易被察覺(jué)，這就是我們所說(shuō)的掩蔽效應。在語(yǔ)音頻譜中，能量較高的頻段即共振峰處的噪聲相對于能量較低頻段的噪聲而言不易被感知。因此在度量原始語(yǔ)音與合成語(yǔ)音之間的誤差時(shí)可計入這一因素。在語(yǔ)音能量高的頻段，允許二者的誤差大一些，從而進(jìn)一步降低編碼比特率。為此引入一個(gè)頻域感覺(jué)加權濾波器W（f）來(lái)計算二者的誤差。感覺(jué)加權濾波器的頻率響應中的峰、谷值正好與語(yǔ)音譜中相反。所以感覺(jué)加權濾波器的作用就是使實(shí)際誤差信號的譜不再平坦，而是有著(zhù)與語(yǔ)音信號譜具有相似的包絡(luò )形狀。這就使誤差度量的優(yōu)化過(guò)程與感覺(jué)上的共振峰對誤差的掩蔽效應相吻合，產(chǎn)生較好的主觀(guān)聽(tīng)覺(jué)效果。

（3）線(xiàn)性預測分析-合成編碼方法

IP網(wǎng)絡(luò )電話(huà)中所使用的語(yǔ)音信號壓縮編碼方式大多數是基于合成-分析法的線(xiàn)性預測編碼（AbS-LPC）方法，這是一種混合編碼方法。線(xiàn)性預測技術(shù)就是用過(guò)去樣點(diǎn)的線(xiàn)性組合來(lái)預測當前樣點(diǎn)。假如用s(n)代表原始語(yǔ)音信號，用線(xiàn)性預測的方法求出預測器的系統ai，構成線(xiàn)性預測逆濾波器，s(n)通過(guò)該濾波器后得到了去除短時(shí)相關(guān)性的語(yǔ)音信號。再將其進(jìn)行基音預測，建立基音逆濾波器，去除它的長(cháng)時(shí)相關(guān)性后，就可得到最后的殘差信號。殘差信號是完全隨機的、不可預測的部分。根據速率的不同要求，可對殘差信號采用不同的量化方法，從而得到不同的編碼速率，讓量化后的殘差信號作為激勵信號依次通過(guò)基音濾波器與線(xiàn)性預測濾波器后，便得到了合成語(yǔ)音信號，見(jiàn)圖1。

編碼的過(guò)程就是不斷改變模型參數，使模型更好地適應原始語(yǔ)音信號。為此又引入了合成分析的概念。同時(shí)，利用人耳的掩蔽效應，引入了感覺(jué)加權濾波器。綜合以上兩方面，可以得到圖2所示的線(xiàn)性預測分析-合成編碼的方框圖。

合成-分析法的基本原理可以概括如下：假定一原理信號可以用一個(gè)模型來(lái)表示，這個(gè)模型又是由一組參數來(lái)決定的，隨著(zhù)這組參數的變化，模型所產(chǎn)生的合成信號也就是一樣，原始信號與合成信號之間的誤差也隨之而變化。為了使模型參數能更好地適應原始信號，可以規定一個(gè)誤差準則：當誤差越小，模型合成信號就和原始信號發(fā)越接近。這樣總線(xiàn)找到一組參數，使誤差最小，此時(shí)這組參數決定的模型就可以用時(shí)，一般在編碼端配備編碼和本地解碼兩個(gè)部分，配備本地解碼的目的是完成合成功能，以便計算原始語(yǔ)音信號與合成語(yǔ)音信號之間的誤差值。為了獲得較好的語(yǔ)音效果，在分析合成語(yǔ)音與原始語(yǔ)音的誤差時(shí)，經(jīng)常采用感覺(jué)加權均方差技術(shù)，即將合成語(yǔ)音與原始誤差最小的一組語(yǔ)音參數。原理圖2中之所以采用反饋控制，是為了求出最佳模型參數，使合成語(yǔ)音與原始語(yǔ)音在某種準確則下最為接近。

基于合成-分析法的線(xiàn)性預測編碼的過(guò)程實(shí)質(zhì)上就是不斷地改變模型參數，使模型更好地適應原始語(yǔ)音信號的過(guò)程。原始語(yǔ)音信號被分成幀，幀的長(cháng)度和模型參數決定了編碼速率。

3 IP網(wǎng)絡(luò )電話(huà)中常用的幾種語(yǔ)音壓縮編碼算法的性能分析

IP網(wǎng)絡(luò )電話(huà)應用主要使用ITU定義的三個(gè)標準：G.723.1、G.728、G.729。它們采用的都是線(xiàn)性預測分析-合成編碼和碼本激勵矢量量化技術(shù)，即混合編碼的方法。

3.1 G.723協(xié)議

G.723協(xié)議是一個(gè)雙速率語(yǔ)音編碼建議，其兩種速率分別是5.3kb/s和6.3kb/s。此協(xié)議是一個(gè)數字傳輸系統概況協(xié)議，適用于低速率多媒體服務(wù)中語(yǔ)音或音頻信號的壓縮算法。它作為完整的H.324系列標準的一部分，是其中語(yǔ)音編碼建議，主要配合低速率圖像編碼H.263標準。在IP電話(huà)網(wǎng)關(guān)中，G.723協(xié)議被用來(lái)實(shí)現實(shí)時(shí)語(yǔ)音編碼解碼處理。

G.723.1協(xié)議的編解碼算法中兩種速率的編解碼基本原理是一樣的，只是激勵信號的量化方法有差別。對高速率（6.3kbit/s）編碼器，其激勵信號采用多脈沖最大似然量化（MP-MLQ）法進(jìn)行量化，對低速率（5.3kbit/s）編碼器，其激勵信號采用代數碼激碼線(xiàn)性預測（ACELP）法量化。

編碼過(guò)程是首先選速率為kbit/s的PCM語(yǔ)音信號轉化成均勻量化的PCM信號，然后把輸入語(yǔ)音信號的每240個(gè)樣點(diǎn)組成一個(gè)帖，也就是30ms的幀長(cháng)。每個(gè)幀通過(guò)高通濾波器后再分為4個(gè)子幀。對于每個(gè)子幀，計算出10階線(xiàn)性預測濾波器的系數。為了適于矢量量化，把預測系數轉化為線(xiàn)性頻譜對（LSP-Line Spectrum Pair），然后進(jìn)行矢量量化。量化前的系數構成短時(shí)感覺(jué)加權濾波器，原始語(yǔ)音信號經(jīng)過(guò)該濾波器得到感覺(jué)加權語(yǔ)音信號。對于每?jì)蓚€(gè)子幀，編碼器用感覺(jué)加權語(yǔ)音信號求得開(kāi)環(huán)基音周期，基音周期范圍從18個(gè)樣點(diǎn)到142個(gè)樣點(diǎn)。此后編碼器所進(jìn)行的操作都是基于60個(gè)樣點(diǎn)進(jìn)行的。由開(kāi)環(huán)基音周期和感覺(jué)加權是在開(kāi)環(huán)基音周期點(diǎn)周?chē)囊欢ǚ秶鷥惹蟮玫?。最后，激勵信號被量化，然后把這些參數和激勵信號量化結果傳送到解碼器。由于幀長(cháng)為30ms，并存在另外的7.5ms的前向延遲，導致37.5ms總的編碼延遲。

G.723.1協(xié)議是為了低速可視會(huì )議業(yè)務(wù)而設計的。由于可視會(huì )議業(yè)務(wù)每秒鐘只傳輸很少數量的幀，而且又有比較大的時(shí)延，這就是G.723.1允許有30ms幀長(cháng)的原因。這個(gè)幀長(cháng)比較大，卻正好適合可視會(huì )議這種情況。而且它的編碼速度比較低，可以把盡可能多的比特用的圖象傳輸上。

3.2 G.728協(xié)議

G.728建議是16kb/s整編語(yǔ)音編碼標準，是H.723協(xié)議中有關(guān)音頻編碼的標準，采用的編碼算法是LD-CELP，即低時(shí)延-碼激勵線(xiàn)性預測的算法。G.728協(xié)議有一般CELP編碼器的共同點(diǎn)：利用合成-分析、感覺(jué)加權、矢量量化和線(xiàn)性預測技術(shù)，從碼本中搜索出最佳矢量，把它乘以最佳增益，代替余量信號作為激勵信號。不同之處在于：一般的CELP編碼器采用前向自適應預測器（Forword Adaptive Predictor）來(lái)去除語(yǔ)音信號的冗余度，而LD-CELP采用后向自適應預測器（Backword Adaptive Predictor）對短時(shí)譜包括和增益進(jìn)行預測。LD-CELP編碼器發(fā)送的只是激勵矢量在碼本中的地址標號，而解碼端的濾波器參數和增益參數都是在解碼端計算得來(lái)的。在大多數編碼系統中，這類(lèi)參數都是在編碼端求得，然后傳輸到解碼端。

LD-CELP的一個(gè)幀只有5個(gè)樣點(diǎn)，因此編碼器只要等5個(gè)樣點(diǎn)就可以開(kāi)始計算最佳激勵矢量。它的線(xiàn)性預測周期是20個(gè)樣點(diǎn)，但編碼器不必等20個(gè)樣點(diǎn)的語(yǔ)音信號才開(kāi)始進(jìn)行線(xiàn)性預測，它用以前已經(jīng)量化的語(yǔ)音信號來(lái)進(jìn)行預測分析。它不用象前向自適應預測器中必須等一幀語(yǔ)音信號到齊后才能進(jìn)行預測分析。因此LD-CELP的延遲很小，為0.625ms，一路編解碼時(shí)延不超過(guò)2ms，完全達到了進(jìn)入公眾網(wǎng)的標準。這種在低時(shí)延下還能保證很高語(yǔ)音質(zhì)量的系統有很好的實(shí)用價(jià)值，付出的代價(jià)是算法計算復雜度很高，約為25MIPS左右。編碼過(guò)程是首先將速率為64kb/s的PCM輸入信號轉化成均勻量化的PCM信號，接著(zhù)由5個(gè)連續的語(yǔ)音樣點(diǎn)組成一個(gè)5維矢量，激勵碼本中共有1024個(gè)5維矢量。對每一個(gè)輸入矢量，編碼器利用合成-分析法從碼本中搜索出最佳碼本矢量，然后將10bits的碼本標號傳給對方。每20個(gè)樣點(diǎn)構成一個(gè)復幀，一個(gè)復幀構成一個(gè)自適應周期，每復幀更新一次LP系數。最佳碼本矢量通過(guò)增益加權和合成濾波器后形成合成語(yǔ)音，該合成語(yǔ)音用來(lái)更新濾波器狀態(tài)，以便繼續為下一個(gè)輸入矢量進(jìn)行編碼。合成濾波器系數和增益分別通過(guò)各自的后向自適應單元進(jìn)行周期性地更新。

G.728建議最大的優(yōu)點(diǎn)是它能提供高質(zhì)量和低過(guò)延的語(yǔ)音。為此，它也要付出一定的代價(jià)，也就是在實(shí)現中和實(shí)際應用中有其它方面的麻煩，如在誤差疊加、計算復雜度（它的線(xiàn)性預測階數是50階，而一般的編碼器是10階）、計算量的分配、互連問(wèn)題等方面存在問(wèn)題。

3.3 G.729協(xié)議

G.729協(xié)議是一個(gè)能在8kb/s速率上實(shí)現高質(zhì)量語(yǔ)音編碼的建議，也是H.323協(xié)議中有關(guān)音頻編碼的標準。在IP電話(huà)網(wǎng)關(guān)中，G.729協(xié)議被用來(lái)實(shí)現實(shí)時(shí)語(yǔ)音編碼處理。G.729協(xié)議采用的是CS-ACELP即共軛結構算術(shù)碼激勵線(xiàn)性預測的算法。CS-ACELP以CELP編碼模型為基礎，它把語(yǔ)音分成幀，每幀10ms，也就是80個(gè)采樣點(diǎn)。對于每一幀語(yǔ)音，編碼器從中分析出CELP模型參數，其中包括線(xiàn)性預測系數，自適應碼本和隨機碼本的索引值和增益。然后把這些參數傳送到解碼端，解碼器利用這些參數構成激勵源和合成濾波器，從而重量現原始語(yǔ)音。

編碼過(guò)程是首先將速率為64kbit/s的PCM語(yǔ)音信號轉化成均勻量化的PCM信號，通過(guò)高通濾波器后，把輸入語(yǔ)音信號的每80個(gè)樣點(diǎn)組成一個(gè)帖，也就是10ms的幀長(cháng)。對于每個(gè)幀用線(xiàn)性預測法求得LP濾波器系數，為了適于矢量量化，把預測系數轉化為線(xiàn)譜對（LSP-Line Spectrum Pair），然后進(jìn)行矢量量化。利用合成-分析方法，使原始語(yǔ)音和合成語(yǔ)音之間的誤差最小，來(lái)獲得最佳激勵信號。激勵信號的量化是通過(guò)兩個(gè)碼本來(lái)實(shí)現的，即自適應碼本和隨機碼本。自適應碼本反映的是長(cháng)時(shí)預測結果，也就是基音預測結果。隨機碼本反映的是經(jīng)過(guò)長(cháng)時(shí)預測和短時(shí)預測后的殘留信號。

3.4 幾種語(yǔ)音壓縮編碼方法的共同之處

它們都是采用的把參數編碼和波形編碼結構起來(lái)所形成了混合編碼?；旌暇幋a有一個(gè)共同的特點(diǎn)，都是都有一個(gè)相同的算是過(guò)程：先進(jìn)行線(xiàn)性預測分析，去掉語(yǔ)音的短時(shí)相關(guān)性，然后再用合成-分析法和感覺(jué)加權均方誤差最小準則分析出合適的替代余量信號的最佳激勵信號，最后對激勵信號和線(xiàn)性預測參數進(jìn)行編碼傳送。

混合編碼中把激勵模型和語(yǔ)音的時(shí)域波形結合到一起，從而改善了合成語(yǔ)音的質(zhì)量。以上三種語(yǔ)音壓縮編碼算法的主要區別在于激勵模型的不同。

雖然IP網(wǎng)絡(luò )電話(huà)目前正處于蒸蒸日上的階段，但它也存在這樣或那樣一些不盡如人意的方面。如何提高IP分組語(yǔ)音通信的質(zhì)量，或者更一般地說(shuō)，如何在IP網(wǎng)絡(luò )上實(shí)現包括實(shí)時(shí)通信業(yè)務(wù)在內的綜合業(yè)務(wù)通信，這正是我們需要進(jìn)一步研究的特點(diǎn)。

tcp/ip相關(guān)文章:tcp/ip是什么

新聞中心

IP網(wǎng)絡(luò )電話(huà)中常用的語(yǔ)音壓縮編碼技術(shù)的性能分析

評論

相關(guān)推薦

技術(shù)專(zhuān)區