多媒體技術(shù)應用之聲音編碼技術(shù)分析
前言
本文引用地址:http://dyxdggzs.com/article/165786.htm多媒體數據類(lèi)型主要有一下幾個(gè)方面:
·圖形和圖像:圖像由象素組成;圖形由圖元組成
文本:最基本的,有多中編碼方式, ASCII碼, 中文的GB碼等等
音頻:WAV文件是計算機中最基礎的聲音記錄形式,對聲波信號進(jìn)行采樣,采樣后經(jīng)過(guò)量化形成數字信號。MIDI格式的數據記錄的實(shí)際是樂(lè )譜(數字音視頻技術(shù))。
·動(dòng)畫(huà)和視頻: 動(dòng)畫(huà)是用計算機生成一系列可供實(shí)時(shí)演播的連續畫(huà)面技術(shù)。視頻是由一幅幅拍攝下來(lái)的真實(shí)畫(huà)面序列組成。
通常情況下,我們將利用計算機技術(shù)把文本、圖像、圖形、動(dòng)畫(huà)、音頻及視頻等多種媒體綜合一體化,使之建立起邏輯上的聯(lián)系,并能夠對它們獲取,編碼,編輯,處理,存儲,傳輸和再現的技術(shù)稱(chēng)之為多媒體技術(shù)。在實(shí)際生活中多媒體技術(shù)應用是非常廣泛的,下面小編以多媒體技術(shù)中聲音編碼技術(shù)為例(音視頻技術(shù)),詳細介紹實(shí)際生活中有關(guān)多媒體技術(shù)應用的相關(guān)知識。
1.G.721 ADPCM編碼器
ADPCM 是利用樣本與樣本之間的高度相關(guān)性和量化階自適應來(lái)壓縮數據的一種波形編碼技術(shù)。
CCITT 為此制定了 G.721 推薦標準 , 這個(gè)標準叫做 32kb/s 自適應差分脈沖Differential Pulse Code Modulation to 24and 40kb/s for Digital Circuit Multiplication Equipment Application , 使用該標準的編碼器的數據率可降低到 40kb/s 和24kb/s 。
CCITT 推薦的 G.721 ADPCM 標準是一個(gè)代碼轉換系統。它使用 ADPCM 轉換技術(shù) , 實(shí)現 64kb/s A 律或μ律 PCM 速率和 32kb/s 速率之間的相互轉換。
2.子帶編碼 (SBC)
子帶編碼主要過(guò)程是:
①使用一組帶通濾波器 (band-pass filter ,BPF) 把輸入音頻信號的頻帶分成若干個(gè)連續的頻段 , 每個(gè)頻段稱(chēng)為子帶。
②對每個(gè)子帶中的音頻信號采用單獨的編碼方案去編碼。
③在信道上傳送時(shí) , 將每個(gè)子帶的代碼復合起來(lái)。
④在接收端譯碼時(shí) , 將每個(gè)子帶的代碼單獨譯碼 , 然后把它們組合起來(lái) , 還原成原來(lái)的音頻信號。
采用對每個(gè)子帶分別編碼的好處:
第一.對每個(gè)子帶信號分別進(jìn)行自適應控制,量化階(quantization step) 的大小可以按照每個(gè)子帶的能量電平加以調節。具有較高能量電平的子帶用大的量化階去量化 , 以減少總的量化噪聲。
·第二,可根據每個(gè)子帶信號在感覺(jué)上的重要性 , 對每個(gè)子帶分配不同的位數 , 用來(lái)表示每個(gè)樣本值。例如 ,在低頻子帶中,為了保護音調和共振峰的結構,就要求較小的量化階、較多的量化級數, 即分配較多的位數來(lái)表示樣本值。而話(huà)音中的摩擦音和類(lèi)似噪聲的聲音,通常出現在高頻子帶中,對它分配較少的位數。
3. 子帶-自適應差分脈沖編碼調制(SB-ADPCM)
采樣率為 8kHz 、 8 位 / 樣本、數據率為 64kb/s 的 G.711 標準是 CCITT 為話(huà)音信號頻率為 (300~3400)Hz制定的編譯碼標準, 這屬于窄帶音頻信號編碼?,F代的話(huà)音編碼技術(shù)已經(jīng)可以減少數據率 ,而又不至于顯著(zhù)降低音質(zhì)。 CCITT 推薦的 8KHz 采樣率、 4 位 / 樣本、 32kb/s 的 G.721 標準, 以及 G.721 的擴充標準 G.723, 都說(shuō)明了話(huà)音壓縮編碼技術(shù)的進(jìn)展。
G.722 是 CCITT 推薦的音頻信號編碼譯碼標準。該標準是描述音頻信號帶寬為 7kHz、數據率為 64kb/s 的編譯碼原理、算法和計算細節。
G.722 的主要目標是保持 64kb/s 的數據率 , 而音頻信號的質(zhì)量要明顯高于 G.711 的質(zhì)量。 G.722 標準把音頻信號采樣頻率由 8kHz 提高到 16KHz, 是 G.711PCM 采樣率的 2 倍 , 因而要被編碼的信號頻率由原來(lái)的 3.4kHz 擴展到 7kHz 。這就使音頻信號的質(zhì)量有很大改善 , 由數字電話(huà)的話(huà)音質(zhì)量提高到調幅 (AM) 無(wú)線(xiàn)電廣播的質(zhì)量。對話(huà)音信號質(zhì)量來(lái)說(shuō) , 提高采樣率并無(wú)多大改善 , 但對音樂(lè )一類(lèi)信號來(lái)說(shuō) , 其質(zhì)量卻有很大提高。
G.722編譯碼系統采用自帶自適應差分脈沖編碼調制技術(shù),把頻帶分成兩個(gè)等帶寬的子代分別是高頻子帶和低頻子帶。在每個(gè)等帶寬的子帶中的信號都用ADPCM進(jìn)行編碼。
4.G.722 SB-ADPCM編譯碼器
為了適應可視電話(huà)會(huì )議日益增長(cháng)的迫切需要 ,1988年CITT 為此制定了G.722 推薦標準, 叫做 數據率為 64kb/s 的 7KHz 聲音信號編碼—— 7kHz Audio-coding with 64kb/s。這個(gè)標準把話(huà)音信號的質(zhì)量由電話(huà)質(zhì)量提高到AM 無(wú)線(xiàn)電廣播質(zhì)量, 而其數據傳輸率仍保持為 64kb/s 。
寬帶話(huà)音是指帶寬在 (50~7000)Hz的話(huà)音 , 這種話(huà)音在可懂度和自然度方面都比帶寬為 (300~3400)Hz 的話(huà)音有明顯的提高, 也更容易識別對方的說(shuō)話(huà)人。
5. 線(xiàn)性預測編碼(LPC)
線(xiàn)性預測編碼是一種非常重要的編碼方法。從原理上講 ,LPC 是通過(guò)分析話(huà)音波形來(lái)產(chǎn)生聲道激勵和轉移函數的參數,對聲音波形的編碼實(shí)際就轉化為對這些參數的編碼,這就使聲音的數據量大大減少。在接收端使用 LPC 分析得到的參數 , 通過(guò)話(huà)音合成器重構話(huà)音。
合成器實(shí)際上是一個(gè)離散的隨時(shí)間變化的時(shí)變線(xiàn)性濾波器,它代表人的話(huà)音生成系統模型 。時(shí)變線(xiàn)性濾波器既當作預測器使用 , 又當作合成器使用。分析話(huà)音波形時(shí) , 主要是當作預測器使用。隨著(zhù)話(huà)音波形的變化,周期性地使模型地參數和激勵條件適合新的要求。
多媒體技術(shù)應用前景及展望
多媒體技術(shù)應用的前景
家庭教育和個(gè)人娛樂(lè )是目前國際多媒體市場(chǎng)的主流
內容演示和管理信息系統是多媒體技術(shù)應用的重要方面
·多媒體通信和分布式多媒體系統是多媒體技術(shù)今后的發(fā)展方向
多媒體技術(shù)應用發(fā)展方向:
一是計算機系統本身的多媒體化;
二是多媒體技術(shù)與點(diǎn)播電視、智能化家電、識別網(wǎng)絡(luò )通信等技術(shù)互相結合,使多媒體技術(shù)進(jìn)入教育、咨詢(xún)、娛樂(lè )。企業(yè)管理和辦公室自動(dòng)化等領(lǐng)域;
三是多媒體技術(shù)與控制技術(shù)相互滲透,進(jìn)入工業(yè)自動(dòng)化測控等領(lǐng)域。
總結
真正的多媒體技術(shù)所涉及的對象是計算機技術(shù)的產(chǎn)物,而其他的單純事物,如電影、電視、音響等,均不屬于多媒體技術(shù)的范疇。本文以聲音編碼技術(shù)為例,詳細介紹實(shí)際生活中有關(guān)多媒體技術(shù)應用的相關(guān)知識及對多媒體技術(shù)應用未來(lái)發(fā)展前景作了簡(jiǎn)單的分析.
鎖相環(huán)相關(guān)文章:鎖相環(huán)原理
評論