<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 消費電子 > 設計應用 > 基于定點(diǎn)DSP的MP3音頻編碼算法研究及實(shí)現

基于定點(diǎn)DSP的MP3音頻編碼算法研究及實(shí)現

作者：時(shí)間：2008-02-25 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

摘要：通過(guò)對心理聲學(xué)模型的簡(jiǎn)化，并在子帶濾波器和量化編碼模塊采用快速算法，大大降低了運算量，在一片100MIPS的定點(diǎn)DSP上實(shí)現了實(shí)時(shí)壓縮。
關(guān)鍵詞：音頻編碼掩蔽閾值心理聲學(xué)模型分析子帶濾波器

MP3是MPEG-1國際標準中音頻壓縮層3的簡(jiǎn)稱(chēng)，單聲道比特率一般取64kbps，在采樣率44．1kHz的情況下，其壓縮比可達12倍以上，被廣泛應用于互聯(lián)網(wǎng)等許多場(chǎng)合。由于解碼比編碼過(guò)程簡(jiǎn)單很多，MP3播放機或隨身聽(tīng)已隨處可見(jiàn)，但MP3編碼在單片定點(diǎn)DSP上實(shí)現，并要保證音質(zhì)，則鮮有耳聞?？紤]到心理聲學(xué)模型在整個(gè)MP3音頻編碼算法中所占比例巨大，筆者從簡(jiǎn)化該模型人手，采用快速算法減少子帶編碼的運算量和數據量，盡可能減少量化編碼的迭代循環(huán)次數，從而在一片美國德州儀器公司的TMS320C549芯片上實(shí)現了MP3的實(shí)時(shí)壓縮，用標準解碼軟件回放，主觀(guān)評定，對于通常的音頻能達到接近CD的音質(zhì)

1 MP3編碼算法及原理

圖1是MP3編碼器的系統方框圖。每聲道以1152個(gè)采樣值為一幀進(jìn)行處理。首先，分析子帶濾波采用正交鏡像濾波器組，將20kHz左右帶寬的信號劃分成相等帶寬的32個(gè)子帶。然后對子帶樣值作MDCT以補償子帶濾波的不足，主要是為提高頻率分辨率、消除由子帶濾波引起的帶間混迭。

同時(shí)采樣值通過(guò)心理聲學(xué)模型計算出各頻帶的掩蔽閾值。

失真控制循環(huán)和非歸一化量化控制循環(huán)是量化編碼循環(huán)過(guò)程，它通過(guò)量化減少各MDCT系數的精度，使編碼比特數得以降低。不同系數采用不同的量化階，人耳敏感的頻率量化精度高，不敏感的頻率量化精度低，量化誤差則不會(huì )被人耳察覺(jué)。選擇量化階的依據就是心理聲學(xué)模型計算出的掩蔽閾值。

最后將量化階等信息以及霍夫曼碼打包成比特流，解碼用。

那么為什么掩蔽閾值能反映人耳的聽(tīng)覺(jué)特點(diǎn)呢?

人耳的聽(tīng)覺(jué)特性涉及生理聲學(xué)和心理聲學(xué)方面的問(wèn)題。例如人耳對不同頻率的聲音感覺(jué)不同就是生理方面的問(wèn)題，其中對2kHz-4kHz的聲音最敏感，且低頻較高頻敏感。敏感程度具體體現為靜態(tài)掩蔽閾值，如圖2虛線(xiàn)所示，表示在安靜的情況下，各種頻率的聲音剛好被聽(tīng)到的音量。與人的心理知覺(jué)有關(guān)的有掩蔽效應等。掩蔽效應指一個(gè)聲音的聽(tīng)覺(jué)感受受到另一個(gè)聲音影響的現象，分為時(shí)間掩蔽(前向、后向掩蔽)和頻率掩蔽(同時(shí)掩蔽)。例如，當一個(gè)較強的聲音停止后，要過(guò)一會(huì )兒才能聽(tīng)到另一個(gè)較弱的聲音，這就是時(shí)間掩蔽效應。頻率掩蔽是指一個(gè)聲音對與其同時(shí)存在的臨近頻率的聲音產(chǎn)生的影響，如圖2實(shí)線(xiàn)所示。其中標志1的實(shí)線(xiàn)表示：當1kHz的掩蔽聲音為60dB時(shí)，不同頻率的聲音剛好被聽(tīng)到的分貝值，可見(jiàn)越臨近頻率被掩蔽得越厲害，且低頻更易掩蔽高頻。

因此心理聲學(xué)模型就先用FFT分析信號中包含的頻率分量，將每個(gè)頻率處受到其他所有頻率分量掩蔽的值加起來(lái)，連線(xiàn)得到的曲線(xiàn)就是掩蔽閾值，是頻率的函數。當某頻率分量的能量處在曲線(xiàn)下方時(shí)，不能被人耳感覺(jué)到，則該頻率分量可用零比特編碼；另一方面，選擇量化階時(shí)若能保證量化噪聲低于掩蔽曲線(xiàn)，也不被人耳察覺(jué)，所以掩蔽閾值越大的頻率分量量化階可以越大。因此用掩蔽閾值作為量化編碼的依據，就能夠保證壓縮后的聲音質(zhì)量。由于聲音信號隨時(shí)間改變，因此每幀信號都要計算兩次心理聲學(xué)模型，其中要用到大量的實(shí)驗測試數據，運算量之大是可想而知的。

2算法的簡(jiǎn)化和優(yōu)化

2.1分析子帶濾波器的快速算法

分析子帶濾波器的輸入是32個(gè)采樣值，輸出是32個(gè)頻率等間隔的子帶樣值。它首先將32個(gè)采樣值放人一個(gè)長(cháng)度512的先進(jìn)先出(FIFO)緩存；對該緩存加窗；然后512個(gè)緩存中每8個(gè)值累加，轉換成64個(gè)中間值；最后通過(guò)(1)式將64個(gè)中間值變換成32個(gè)采樣值：

尋找快速算法的關(guān)鍵就是這最后一步。將系數設為數組：

可以發(fā)現該數組具有如下的對稱(chēng)性：

所以合并系數相等或相反的項，(1)式變成：

可見(jiàn)用（5）式代替（1）式可以減少一半的乘法運算。又發(fā)現(5)式和標準的IDCT非常相似，可以將Lee提出的快速I(mǎi)DCT算法稍加改動(dòng)推導(5)式的快速算法。所以又將32點(diǎn)變換分解成以下的兩個(gè)16點(diǎn)變換：

直接計算(1)式需要6432次乘法和6332次加法，采用快速算法需16162+162次乘法和15162+162+31+15次加法，運算量為原來(lái)的1／4，而且數據表格所占用的存儲空間也減少為原來(lái)的1／8左右。

2.2心理聲學(xué)模型的簡(jiǎn)化

根據試驗觀(guān)察發(fā)現每幀的掩蔽閾值曲線(xiàn)大致相同，所以考慮采用靜態(tài)聲學(xué)心理模型，具體做法是：首先對某一具有代表性的音頻幀，根據心理聲學(xué)模型計算出掩蔽閾值曲線(xiàn)，在壓縮其它音頻源時(shí)，不再計算每幀的心理聲學(xué)模型，而是認為每幀信號與上述被分析過(guò)的代表幀具有相同的掩蔽特性。這樣，雖然不是很準確，但通常情況下，誤差不會(huì )太大，不易被人耳察覺(jué)，省去心理聲學(xué)模型所需的巨大運算量和存儲空間。實(shí)踐證明編碼效果令人滿(mǎn)意，而且對于要求不是很高的應用場(chǎng)合，可以認為掩蔽閾值是頻率的常數函數，每個(gè)頻帶采用相同的量化階，也聽(tīng)不出聲音質(zhì)量的明顯下降。

2.3量化編碼迭代循環(huán)的簡(jiǎn)化

量化編碼迭代是兩重循環(huán)過(guò)程，圖3是外迭代循環(huán)流圖，迭代的目的是在可用比特數的限制之內，以各頻帶的掩蔽值為依據，確定全局增益(體現了全局量化階)和各頻帶的縮放因子(體現了局部量化階)。內循環(huán)逐步增加量化器步長(cháng)，即全局增益，直到MDCT系數量化后可被可用比特進(jìn)行霍夫曼編碼，即通過(guò)增加全局量化階以降低編碼比特數；外循環(huán)依據掩蔽閾值檢測各縮放因子帶的失真，若超過(guò)允許失真，則擴大該帶的MDCT系數，即增大該帶的縮放因子，以降低局部失真；最后一次迭代的結果作為最終的霍夫曼碼。每一次循環(huán)都要用當前的量化階量化并霍夫曼編碼一次，運算量相當大。從外循環(huán)可以看出掩蔽閾值最終決定縮放因子，為了能省去外迭代循環(huán)，將代表幀的縮放因子作成表格，供每幀采用。

由于上述三個(gè)模塊是最主要并且運算量最大的模塊，通過(guò)對它們的簡(jiǎn)化和優(yōu)化，程序的大小和運算量可得到極大的減少。

3用定點(diǎn)DSP實(shí)現MP3壓縮算法

為了實(shí)現MP3的實(shí)時(shí)編碼，必須采用高速DSP芯片。采用美國德州儀器(T1)公司的主流定點(diǎn)DSP芯片TMS320C549，其運算速度是 100MIPS，調試開(kāi)發(fā)的環(huán)境是TI公司的第三方Spectrum Digital公司的EVM評估板，板上除了TMS320C549自帶的32K字片上內存外，還有128K字片外內存，數模轉換采用TI的 TLC320AD55，與PC機通過(guò)JTAG口實(shí)現數據與程序的加載和調試。

由于評估板與主機的接口速度太慢，即使能做到實(shí)時(shí)壓縮，將比特流傳給PC機存盤(pán)的速度也會(huì )跟不上。因此筆者采用的辦法是：將原始PCM音頻數據從PC機的硬盤(pán)文件加載到板上的片外內存，壓縮后的數據傳給PC機存盤(pán)，再加載后續文件，壓縮存盤(pán)，直到整個(gè)音頻文件全部壓縮完，最后用C語(yǔ)言程序將各數據塊拼成 MP3文件，用軟件解碼程序回放。是否能達到實(shí)時(shí)要求只能通過(guò)測試每幀運行的指令數判斷。

在運用快速算法計算子帶分析濾波器時(shí)，考慮到DSP芯片的特點(diǎn)，每分解一次，要作一次如(10)式的加法，勢必降低精度，另外(11)和(12)式的系數動(dòng)態(tài)范圍太大，精度也會(huì )受到影響，因此，只分解到16點(diǎn)DCT運算。

采用靜態(tài)心理聲學(xué)模型，心理聲學(xué)模型和量化編碼外循環(huán)所需的運算量就為零。代表幀的心理聲學(xué)模型和縮放因子采用C語(yǔ)言或MATLAB語(yǔ)言編程計算，或者將網(wǎng)上下載的MP3文件中的縮放因子信息破譯出來(lái)加以利用，子帶分析濾波器之后的MDCT全部采用長(cháng)塊。表1是靜態(tài)縮放因子比特數和縮放因子的一種設置方案。

另外在內循環(huán)中，首先初步選擇一個(gè)全局增益使最大量化值小于碼表可編碼的最大值，標準推薦的作法是全局增益從小開(kāi)始，每循環(huán)一次量化后，比較最大量化值，并調整一次全局增益，直到滿(mǎn)足要求為止。本程序省去了這一循環(huán)，事先根據最大譜線(xiàn)值計算出應有的全局增益，作成數據表格，程序中只需根據最大譜線(xiàn)值查表即可。初始化全局增益確定后，要分區、量化、編碼并計算編碼比特數，如果比特數太大或太小都還要調整全局增益。對這一迭代循環(huán)過(guò)程，采用折牛搜索的辦法實(shí)現，也就是說(shuō)第一次循環(huán)時(shí)全局增益取上述初始化值的一半，若編碼比特數超出要求，則再取一半作為新的全局增益，否則增大一半，如此不斷循環(huán)直到無(wú)法折半為止。這種折半搜索的方法比逐一搜索要快很多。

采用了這些簡(jiǎn)化、優(yōu)化措施以及編程技巧，整個(gè)編碼程序運算量?jì)H需75MIPS左右，片上存儲空間占用27K字左右。用標準的MP3回放軟件解碼，通過(guò)主觀(guān)測評，音質(zhì)接近CD。

由于本系統對心理聲學(xué)模型進(jìn)行了大量的簡(jiǎn)化，對于一般的音樂(lè )，這種簡(jiǎn)化帶來(lái)的聲音質(zhì)量的下降并不明顯，尤其是在要求不高的應用場(chǎng)合完全可行。但是當應用到某些編碼難度較高的音頻信號，例如響板時(shí)，聲音質(zhì)量下降較明顯。因此如果采用更高運算速度的DSP，可在該編碼系統中加入一個(gè)完備的或簡(jiǎn)化的動(dòng)態(tài)心理聲學(xué)模型，編碼質(zhì)量可進(jìn)一步提高，至于簡(jiǎn)化的動(dòng)態(tài)心理聲學(xué)模型還有待進(jìn)一步摸索。

參考文獻

1 Draft International Standard ISO／IEC CD 11172―3．1992

2王劍虹，吳海華，陳?。甅PEG音頻解碼中子帶合成濾波器的快速算法及定點(diǎn)DSP實(shí)現．上海交通大學(xué)學(xué)報，2000；34(6)：761-764

3陳健，李力利，陳亞駿．MUSICAM算法仿真及DSP實(shí)現．上海交通大學(xué)學(xué)報，1997；31(1)：74-78

4吳海華，王劍虹，陳?。玫蛢r(jià)型DSP實(shí)現MP3解碼．電聲技術(shù)，1999，10：11-14

5 Byeong Gi Lee．FCT―A Fast Cosine Transform．ICASSP， San Diego．Califonia，America，1984；10(2)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：算法研究 實(shí)現 編碼音頻 定點(diǎn) DSP MP3 基于

評論

相關(guān)推薦

TMS320LF240x DSP應用程序設計教程

資源下載 TI TMS320LF240x DSP 應用程序設計 | 2007-12-08

SHIPT算法擠壓了外包工人如何對雇主進(jìn)行審計

智能計算 SHIPT 算法算法管理 | 2024-07-04

TI DSP開(kāi)發(fā)工具CCS上AET調試功能

視頻 TI DSP DSP AET CCS | 2009-10-16

計算機音頻工作站總論--音頻工作站與硬盤(pán)錄音機同類(lèi)比較(轉載）

hpnet | 2002-05-15

C64+ 系列DSP上Cache 的應用（第二部分）

視頻 TI DSP C64+ Cache | 2009-10-16

DSP芯片的原理與開(kāi)發(fā)應用

資源下載 TI DSP 開(kāi)發(fā)原理 | 2007-12-15

[轉帖]us/os就緒表的維護算法分析

amine | 2002-05-17

“進(jìn)芯電子”為DSP電機控制帶來(lái)國風(fēng)新勢力

工控自動(dòng)化 202405 進(jìn)芯 DSP 電機控制 | 2024-04-17

C64+ 系列DSP上Cache 的應用（第一部分）

視頻 TI DSP C64+ Cache | 2009-10-16

超強整理！電機控制算法

電機算法 BLDC | 2024-05-21

恩智浦SAF9xxx發(fā)布，汽車(chē)AI音頻處理升級！

汽車(chē)電子汽車(chē)音頻 DSP SDV 汽車(chē)娛樂(lè )系統 | 2024-06-21

利用PIC12C508單片機來(lái)實(shí)現加密狗技術(shù)[轉帖]

hpnet | 2002-05-19

高性能系列DSP上TCP2/VCP2協(xié)處理器

視頻 TI DSP VCP2 TCP2 協(xié)處理器 | 2009-10-16

模擬電路PWM的實(shí)現

設計方案模擬電路實(shí)現 | 2009-07-06

AN7100S雙聲道音頻功率放大電路

設計方案 AN7100S 聲道音頻功率放大電路 | 2009-07-06

華為最強科普：什么是DSP？

嵌入式系統 DSP | 2024-05-20

Snapdragon Sound驍龍暢聽(tīng)技術(shù)助力全新Bose SoundLink Max手提音箱帶來(lái)“派對級”音頻體驗

消費電子 Snapdragon Sound 驍龍暢聽(tīng) Bose SoundLink Max 手提音箱派對級音頻 | 2024-05-31

DSP 入門(mén)教程

資源下載 TI DSP 選型技術(shù)介紹 | 2007-12-14

集成音頻功率放大電路LM380

設計方案集成音頻功率放大電路 LM380 | 2009-07-06

仿真器概念及實(shí)現技術(shù)

jackwang | 2002-05-14

基于運放的差動(dòng)放大器

設計方案基于運放差動(dòng) 放大器 | 2009-07-06

Cadence擴充Tensilica Vision產(chǎn)品線(xiàn)，新增毫米波雷達加速器及針對汽車(chē)應用優(yōu)化的新款DSP

EDA/PCB Cadence Tensilica Vision 毫米波雷達加速器 DSP | 2024-03-05

基于RC電路的一次性濾波器

設計方案基于電路一次性濾波器 | 2009-07-06

進(jìn)芯電子攜多款DSP芯片及消費電子解決方案亮相2024中國制冷展

工控自動(dòng)化進(jìn)芯電子 DSP 中國制冷展 | 2024-04-10

通信接收機：DSP、軟件無(wú)線(xiàn)電和設計

資源下載 DSP 軟件無(wú)線(xiàn)電通信接收機 | 2007-12-11

專(zhuān)為客戶(hù)設計的高性能器件系列

視頻 TI DSP TMS320C6474 C6474 AIF | 2009-10-16

vxworks下bsp制作教程(老站轉)

amine | 2002-05-28

充電器算法復雜傳統MCU難以勝任？不如試試這些集成DSP內核的MCU

嵌入式系統 DSP MCU | 2024-05-15

嵌入式開(kāi)發(fā)者都該了解的十大算法

嵌入式開(kāi)發(fā)者算法 | 2024-07-16

MP3 TO CD

資源下載 MP3 CD Converter 歌曲轉換 MP3 CD Converter軟件 | 2007-11-27

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>