視頻壓縮編解碼標準綜述
(3)通用的訪(fǎng)問(wèn)性
MPEG-4提供了易出錯環(huán)境的魯棒性,來(lái)保證其在許多無(wú)線(xiàn)和有線(xiàn)網(wǎng)絡(luò )以及存儲介質(zhì)中的應用,此外,MPEG-4還支持基于內容的的可分級性,即把內容、質(zhì)量、復雜性分成許多小塊來(lái)滿(mǎn)足不同用戶(hù)的不同需求,支持具有不同帶寬,不同存儲容量的傳輸信道和接收端。
這些特點(diǎn)無(wú)疑會(huì )加速多媒體應用的發(fā)展,從中受益的應用領(lǐng)域有:因特網(wǎng)多媒體應用;廣播電視;交互式視頻游戲;實(shí)時(shí)可視通信;交互式存儲媒體應用;演播室技術(shù)及電視后期制作;采用面部動(dòng)畫(huà)技術(shù)的虛擬會(huì )議;多媒體郵件;移動(dòng)通信條件下的多媒體應用;遠程視頻監控;通過(guò)ATM網(wǎng)絡(luò )等進(jìn)行的遠程數據庫業(yè)務(wù)等。MPEG-4主要應用如下:
(1)應用于因特網(wǎng)視音頻廣播
由于上網(wǎng)人數與日俱增,傳統電視廣播的觀(guān)眾逐漸減少,隨之而來(lái)的便是廣告收入的減少,所以現在的固定式電視廣播最終將轉向基于TCP/IP的因特網(wǎng)廣播,觀(guān)眾的收看方式也由簡(jiǎn)單的遙控器選擇頻道轉為網(wǎng)上視頻點(diǎn)播。視頻點(diǎn)播的概念不是先把節目下載到硬盤(pán),然后再播放,而是流媒體視頻(streaming video),點(diǎn)擊即觀(guān)看,邊傳輸邊播放。
現在因特網(wǎng)中播放視音頻的有:Real Networks公司的 Real Media,微軟公司的 Windows Media,蘋(píng)果公司的 QuickTime,它們定義的視音頻格式互不兼容,有可能導致媒體流中難以控制的混亂,而MPEG-4為因特網(wǎng)視頻應用提供了一系列的標準工具,使視音頻碼流具有規范一致性。因此在因特網(wǎng)播放視音頻采用MPEG-4,應該說(shuō)是一個(gè)安全的選擇。
(2)應用于無(wú)線(xiàn)通信
MPEG-4高效的碼率壓縮,交互和分級特性尤其適合于在窄帶移動(dòng)網(wǎng)上實(shí)現多媒體通信,未來(lái)的手機將變成多媒體移動(dòng)接收機,不僅可以打移動(dòng)電視電話(huà)、移動(dòng)上網(wǎng),還可以移動(dòng)接收多媒體廣播和收看電視。
(3)應用于靜止圖像壓縮
靜止圖像(圖片)在因特網(wǎng)中大量使用,現在網(wǎng)上的圖片壓縮多采用JPEG技術(shù)。MPEG-4中的靜止圖像(紋理)壓縮是基于小波變換的,在同樣質(zhì)量條件下,壓縮后的文件大小約是JPEG壓縮文件的十分之一。把因特網(wǎng)上使用的JPEG圖片轉換成MPEG-4格式,可以大幅度提高圖片在網(wǎng)絡(luò )中的傳輸速度。
(4)應用于電視電話(huà)
傳統用于窄帶電視電話(huà)業(yè)務(wù)的壓縮編碼標準,如H261,采用幀內壓縮、幀間壓縮、減少象素和抽幀等辦法來(lái)降低碼率,但編碼效率和圖像質(zhì)量都難以令人滿(mǎn)意。MPEG-4的壓縮編碼可以做到以極低碼率傳送質(zhì)量可以接受的聲像信號,使電視電話(huà)業(yè)務(wù)可以在窄帶的公用電話(huà)網(wǎng)上實(shí)現。
(5)應用于計算機圖形、動(dòng)畫(huà)與仿真
MPEG-4特殊的編碼方式和強大的交互能力,使得基于MPEG-4的計算機圖形和動(dòng)畫(huà)可以從各種來(lái)源的多媒體數據庫中獲取素材,并實(shí)時(shí)組合出所需要的結果。因而未來(lái)的計算機圖形可以在MPEG-4語(yǔ)法所允許的范圍內向所希望的方向無(wú)限發(fā)展,產(chǎn)生出今天無(wú)法想象的動(dòng)畫(huà)及仿真效果。
(6)應用于電子游戲
MPEG-4可以進(jìn)行自然圖像與聲音同人工合成的圖像與聲音的混合編碼,在編碼方式上具有前所未有的靈活性,并且能及時(shí)從各種來(lái)源的多媒體數據庫中調用素材。這可以在將來(lái)產(chǎn)生象電影一樣的電子游戲,實(shí)現極高自由度的交互式操作。
4.MPEG-7標準
MPEG-7標準被稱(chēng)為“多媒體內容描述接口”,為各類(lèi)多媒體信息提供一種標準化的描述,這種描述將與內容本身有關(guān),允許快速和有效的查詢(xún)用戶(hù)感興趣的資料。它將擴展現有內容識別專(zhuān)用解決方案的有限的能力,特別是它還包括了更多的數據類(lèi)型。換而言之,MPEG-7規定一個(gè)用于描述各種不同類(lèi)型多媒體信息的描述符的標準集合。該標準于1998年10月提出。
MPEG-7的目標是支持多種音頻和視覺(jué)的描述,包括自由文本、N維時(shí)空結構、統計信息、客觀(guān)屬性、主觀(guān)屬性、生產(chǎn)屬性和組合信息。對于視覺(jué)信息,描述將包括顏色、視覺(jué)對象、紋理、草圖、形狀、體積、空間關(guān)系、運動(dòng)及變形等。
MPEG-7的目標是根據信息的抽象層次,提供一種描述多媒體材料的方法以便表示不同層次上的用戶(hù)對信息的需求。以視覺(jué)內容為例,較低抽象層將包括形狀、尺寸、紋理、顏色、運動(dòng)(軌道)和位置的描述。對于音頻的較低抽象層包括音調、調式、音速、音速變化、音響空間位置。最高層將給出語(yǔ)義信息:如“這是一個(gè)場(chǎng)景:一個(gè)鴨子正躲藏在樹(shù)后并有一個(gè)汽車(chē)正在幕后通過(guò)。”抽象層與提取特征的方式有關(guān):許多低層特征能以完全自動(dòng)的方式提取,而高層特征需要更多人的交互作用。MPEG-7還允許依據視覺(jué)描述的查詢(xún)去檢索聲音數據,反之也一樣。
MPEG-7的目標是支持數據管理的靈活性、數據資源的全球化和互操作性。
MPEG-7標準化的范圍包括:一系列的描述子(描述子是特征的表示法,一個(gè)描述子就是定義特征的語(yǔ)法和語(yǔ)義學(xué));一系列的描述結構(詳細說(shuō)明成員之間的結構和語(yǔ)義);一種詳細說(shuō)明描述結構的語(yǔ)言、描述定義語(yǔ)言(DDL);一種或多種編碼描述方法。
在我們的日常生活中,日益龐大的可利用音視頻數據需要有效的多媒體系統來(lái)存取、交互。這類(lèi)需求與一些重要的社會(huì )和經(jīng)濟問(wèn)題相關(guān),并且在許多專(zhuān)業(yè)和消費應用方面都是急需的,尤其是在網(wǎng)絡(luò )高度發(fā)展的今天,而MPEG-7的最終目的是把網(wǎng)上的多媒體內容變成象現在的文本內容一樣,具有可搜索性。這使得大眾可以接觸到大量的多媒體內容,MPEG-7標準可以支持非常廣泛的應用,具體如下:
(1)音視數據庫的存儲和檢索;
(2)廣播媒體的選擇(廣播、電視節目);
(3)因特網(wǎng)上的個(gè)性化新聞服務(wù);
(4)智能多媒體、多媒體編輯;
(5)教育領(lǐng)域的應用(如數字多媒體圖書(shū)館等);
(6)遠程購物;
(7)社會(huì )和文化服務(wù)(歷史博物館、藝術(shù)走廊等);
(8)調查服務(wù)(人的特征的識別、辯論等);
(9)遙感;
(10)監視(交通控制、地面交通等);
(11)生物醫學(xué)應用;
(12)建筑、不動(dòng)產(chǎn)及內部設計;
(13)多媒體目錄服務(wù)(如,黃頁(yè)、旅游信息、地理信息系統等);
(14)家庭娛樂(lè )(個(gè)人的多媒體收集管理系統等)。
原則上,任何類(lèi)型的AV(Audio-Video)材料都可以通過(guò)任何類(lèi)型的查詢(xún)材料來(lái)檢索,例如,AV材料可以通過(guò)視頻、音樂(lè )、語(yǔ)言等來(lái)查詢(xún),通過(guò)搜索引擎來(lái)匹配查詢(xún)數據和MPEG-7的音視頻描述。下面給出幾個(gè)查詢(xún)例子:
音樂(lè ):在鍵盤(pán)上彈幾個(gè)音符就能得到包含(或近似)要求曲調的音樂(lè )作品列表,或以某種方式匹配音符的圖象,例如,從情感方面。
評論