多聲道數字音頻系統的編碼及應用
由于A(yíng)C-3比特流中同步結構中的AB0~AB5是獨立解碼的,因此可以將這些編碼信號重新構造為所需的輸
出信號,即輸出的下行兼容性。本文引用地址:http://dyxdggzs.com/article/166943.htm
在許多重放系統中,揚聲器的數目不能同編碼的音頻聲道的數目匹配。為了重現完整的音頻節目需要向下混合。在幀同步中,AB0~AB5中記錄著(zhù)六個(gè)獨立聲道的音頻數據,按照AC-3重放時(shí)的安排,我們稱(chēng)之為L(cháng)、R、C、Ls、Rs、LFE。一般用于向下混合的過(guò)程中,低音增強LFE通道記錄的音頻信號主要用于渲染烘托氣氛,所以向下混合時(shí),只用其中的L、R、C、Ls、Rs。從圖中可以看到編碼后的AC-3數據流可以直接傳輸后經(jīng)解碼器解碼為5.1通道音頻信息進(jìn)行重放,也可以向下混合為兩個(gè)聲道信號,然后經(jīng)不同的解碼器得到不同的重放模式。就單一環(huán)繞聲道(n/1模式)而言,把S稱(chēng)為單個(gè)環(huán)繞聲道。從圖中可看出,向下混合提供兩種類(lèi)型:向下混合為L(cháng)t、Rt矩陣環(huán)繞編碼的立體聲對;
向下混合為通常的立體聲信號Lo、Ro。向下混合的立體聲信號(Lo、Ro或Lt、Rt)可進(jìn)一步向下混合為單聲道M,通過(guò)兩個(gè)聲道簡(jiǎn)單的相加即可。如果將Lt、Rt向下混合為單聲道,環(huán)繞信息將會(huì )丟失。當希望需要一個(gè)單聲道信號時(shí)則Lo、Ro向下混合更可取。
用于Lo、Ro立體聲信號的一般3/2向下混合方程式為:
Lo=1.0′L+clev′C+slev′Ls;
Ro=1.0′R+clev′C+slev′Rs;
如果接著(zhù)Lo、Ro被組合成單聲道信號重放,有效的向下混合方程式為:
M=1.0′L+2.0′clev′C+1.0′R+slev′Ls+slev′Rs;
如果只出現單個(gè)環(huán)繞聲道S(3/1模式),則向下混合方程式為:
Lo=1.0′L+clev′C+0.7′slev′S;
Ro=1.0′R+clev′C+0.7′slev′S;
M=1.0′L+2.0′clev′C+1.0′R+1.4′slev′S;
其中clev、slev分別代表中央聲道混合聲級系數和環(huán)繞聲道混合聲級系數,在BSI數據中由Cmixlev、Surmixlev比特字段來(lái)指出相對應的值。
用于Lt、Rt立體聲信號的一般3/2向下混合方程式為:
Lt=1.0′L+0.707′C-0.707′Ls-0.707′Rs;
Rt=1.0′R+0.707′C+0.707′Ls+0.707′Rs;
如果只出現單個(gè)環(huán)繞聲道S(3/1模式),則向下混合方程式為:
Lt=1.0′L+0.707′C-0.707′S;
Rt=1.0′R+0.707′C+0.707′S;
經(jīng)過(guò)對獨立聲道的音頻信號進(jìn)行不同的分配及矩陣重組,則實(shí)現了AC-3數據流的向下兼容性, 意即通過(guò)不同的解碼器、解碼矩陣方式,可以得到杜比數字5.1聲道環(huán)繞聲、立體聲、杜比Prologic、單聲道以及杜比的虛擬環(huán)繞聲方式。其中Lo、Ro與Lt、Rt的最大區別就是Lt、Rt是記錄的全部的L、R、環(huán)繞聲的信息,經(jīng)過(guò)矩陣重解可得到環(huán)繞聲信息,而Lo、Ro則是將環(huán)繞聲信息增加支立體聲信號中,無(wú)法再重現環(huán)繞聲信號信息。
4、MPEG-2多聲道編解碼過(guò)程
MPEG-2感知編碼系統充分利用了心理聲學(xué)中的掩蔽效應和哈斯效應,利用壓縮編碼技術(shù),將原始音頻信號中不相關(guān)分量和冗余分量有效的去除掉,在不影響人耳聽(tīng)覺(jué)閾度和聽(tīng)音效果質(zhì)量上,將音頻信號壓縮。
4.1MPEG音頻子帶編碼器的基本結構
感知型子帶音頻編碼器不斷地對音頻輸入信號進(jìn)行分析。由一個(gè)心理聲學(xué)模型動(dòng)態(tài)地確定掩蔽門(mén)限,即在該掩蔽門(mén)限之下的多余的噪聲是無(wú)法為人的聽(tīng)覺(jué)系統聽(tīng)到的。由該心理聲學(xué)模型產(chǎn)生的信息被饋至一個(gè)比特分配模塊,該模塊的任務(wù)是將各聲道可用的比特以一種優(yōu)化的方式在頻譜范圍內進(jìn)行分配。輸入信號還與上述過(guò)程并行地被分割到一系列稱(chēng)為子帶的頻帶中。每個(gè)子帶信號都在經(jīng)過(guò)定
標處理后被重新進(jìn)行量化,該量化編碼過(guò)程引入的量化噪聲不能超過(guò)已確定的對應子帶的掩蔽門(mén)限。因此量化噪聲頻譜就與信號頻譜進(jìn)行了動(dòng)態(tài)自適應?!氨壤蜃印焙透髯訋褂玫牧炕鞯南嚓P(guān)信息與編碼后的子帶樣值一同進(jìn)行傳輸。
解碼器可以在不了解編碼器如何確定編碼所需信息的情況下對碼流進(jìn)行解碼。這可以降低解碼器的復雜度,并為編碼器的選擇和解碼器開(kāi)發(fā)提供了很大的靈活性。如在心理聲學(xué)研究上取得了新的結果,則更高效率和更高性能的編碼器可在與所有現有解碼器完全兼容的條件下得以應用。這一靈活性目前已有了成功的例子,現在最高技術(shù)水平的編碼器的性能已超過(guò)了標準化過(guò)程中使用的早期編碼器。
4.2層
MPEG音頻標準包括了三種不同的算法,稱(chēng)為層。層數越高,相應可達到的壓縮比就越高,而復雜度、延時(shí)及對傳輸誤碼的敏感度也越高。層II專(zhuān)門(mén)對廣播應用進(jìn)行了優(yōu)化。它使用了具有32個(gè)等寬子帶劃分的子帶濾波,自適應比特分配和塊壓擴。單聲道的碼率范圍為32-192kbps,立體聲為64-384kbps。
它在256kbps及192kbps相關(guān)立體聲條件下的表現十分出色。128kbps(立體聲)條件下的性能在許多應用中仍可接受。
4.3MPEG-2在多聲道音頻方面的擴展
ITU-R工作組TG10-1在關(guān)于多聲道聲音系統的建議方面進(jìn)行了工作。該項工作的主要成果就是建議BS.775,其中說(shuō)明一個(gè)適當的多聲道聲音配置應包含五個(gè)聲道,分別代表左、中央、右、左環(huán)繞、右環(huán)繞聲道。如果使用了一個(gè)作為選項的低頻增強聲道(LFE),則該配置被稱(chēng)為“5.1”。五聲道配置也可表示為‘3/2’,即三個(gè)前置聲道及兩個(gè)環(huán)繞(后置)聲道。
MPEG已認識到應根據ITU-R建議775來(lái)增加音頻標準的多聲道能力的必要性。
這是在第二階段完成的,由此產(chǎn)生了MPEG-2音頻標準。在多聲道聲音方面的擴展支持在一路碼流中傳輸五個(gè)輸入聲道、低頻增強聲道以及7個(gè)旁白聲道。該擴展與MPEG-1保持前向及后向兼容。前向兼容性意味著(zhù)多聲道解碼器可正確地對立體聲碼流進(jìn)行解碼。后向兼容性則意味著(zhù)一個(gè)標準的立體聲解碼器
在對多聲道碼流進(jìn)行解碼時(shí)可輸出兼容的立體聲信號。
這是通過(guò)一種真正的可分級方式實(shí)現的。在編碼器端,五個(gè)輸入聲道被向下混合為一路兼容立體聲信號。該兼容立體聲信號按照MPEG-1標準進(jìn)行編碼。所有用于在解碼器端恢復原來(lái)的五個(gè)聲道的信息都被置于MPEG-1的附加數據區內,該數據區被MPEG-1解碼器忽略。這些附加的信息在信息聲道T2、T3及T4以及LFE聲道中傳輸,這幾個(gè)信息聲道通常包含中央、左環(huán)繞和右環(huán)繞聲道。MPEG-2多聲道解碼器不但對碼流中的MPEG-1部分進(jìn)行解碼,還對附加信息聲道T2、T3、T4及LFE解碼。根據這些信息,它可以恢復原來(lái)的5.1聲道聲音。
當相同碼流饋送至MPEG-1解碼器時(shí),解碼器將只對碼流的MPEG-1部分進(jìn)行解碼,而忽略所有附加的多聲道信息。由此它將輸出在MPEG-2編碼器中經(jīng)向下混合產(chǎn)生的兩個(gè)聲道。這種方式實(shí)現了與現有的雙聲道解碼器的兼容性。也許更為重要的是,這種可分級的方式使得即使在多聲道業(yè)務(wù)中仍可使用低成 本的雙聲道解碼器??紤]到所使用的其它所有編碼策略,多聲道業(yè)務(wù)中的雙聲道解碼器本質(zhì)上就是一 個(gè)對所有聲道進(jìn)行解碼并在解碼器中產(chǎn)生雙聲道向下混合信號的多聲道解碼器。如圖14所示。

就其包含了不同的可由編碼器使用以進(jìn)一步提高音頻質(zhì)量的技術(shù)而言,該標準是具有很大靈活性的。
4.4定向邏輯兼容性
如果源素材已經(jīng)經(jīng)過(guò)環(huán)繞聲編碼(如Dolby環(huán)繞聲),廣播業(yè)者可能希望將它直接播送給聽(tīng)眾。一種選擇是將該素材直接以2/0(僅為立體聲)模式播送。環(huán)繞聲編碼器主要是將中央聲道信號分別與左右聲道信號同相相加,而將環(huán)繞聲道信號分別與左右聲道信號反相相加。為能對這些信息正確解碼,編解碼器必須保持左右聲道彼此之間的幅度和相位關(guān)系。這在MPEG編碼中是通過(guò)限制強度立體聲編碼只能在高于8kHz的頻率范圍內使用而得以保障的,因為環(huán)繞聲編碼僅在低于7kHz的范圍內使用環(huán)繞聲道信息。如圖15所示。

圖15使用MPEG-1音頻播送環(huán)繞聲素材
當傳輸多聲道信息時(shí),與現有(專(zhuān)利的)環(huán)繞聲解碼器的兼容性可通過(guò)幾種手段得以實(shí)現。多聲
道編碼器在工作時(shí)使用一個(gè)環(huán)繞聲兼容的矩陣。這可以使立體聲解碼器能夠接收環(huán)繞聲編碼的信號,
并可選擇將其傳送給環(huán)繞聲解碼器。一個(gè)完整的多聲道解碼器將對所有信號進(jìn)行再變換,以獲得原來(lái)
的多聲道表現。MPEG-2多聲道語(yǔ)法支持這種模式,進(jìn)而也為DVB規范所支持。如圖16所示。

4.5MPEG-2在低采樣率方面的擴展
除了在多聲道方面的擴展外,MPEG-2音頻還包含了MPEG-1音頻在低采樣率方面的擴展。該擴展的目的是以一種簡(jiǎn)單的方式獲得改進(jìn)的頻譜分辨率。通過(guò)將采樣率減半,頻率分辨率就提高了兩倍,但時(shí)間分辨率則劣化了兩倍。這可使許多穩態(tài)信號獲得更好的質(zhì)量,而對一些在時(shí)間特性上要求嚴格的信號而言質(zhì)量則下降了。半采樣率的使用是在碼流中通過(guò)將每幀幀頭中的某一比特,即ID位置設為“0”來(lái)表示的。而且,可用碼率表也進(jìn)行了修改,以便在低碼率條件下提供更多的選擇,每個(gè)子帶可用的量化器也為適應更高的頻率分辨率作了修改。
5、先進(jìn)音頻編碼(AdvancedAudioCoding-AAC)
MPEGAAC(先進(jìn)音頻編碼)是于1997年成為ISO/IEC標準的(參見(jiàn)ISO/IEC13818)。AAC是以新建立的MPEG-4標準中的時(shí)域到頻域映射的編碼算法組成的。AAC從提高效率的角度出發(fā),放棄了與原MPEG-1解碼器的后向兼容性,這也是該算法在開(kāi)始時(shí)被稱(chēng)為NBC的原因。
評論