MPEG聲音編碼的單片DSP實(shí)現

作者：時(shí)間：2011-01-09 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

本文引用地址：http://dyxdggzs.com/article/151117.htm

MPEG聲音編碼是一種基于人耳聽(tīng)覺(jué)特性的子帶聲音編碼算法，它屬于一種感覺(jué)聲音編碼方法.感覺(jué)聲音編碼算法的基本結構如圖1所示.根據編碼器著(zhù)重于頻率分辨率還是時(shí)間分辨率，可分為子帶編碼器和變換編碼器.MPEG聲音第2層編碼算法在頻域上把聲音信號劃分為32個(gè)子帶，屬于一種子帶編碼器.在圖1中，時(shí)頻映射也稱(chēng)濾波器組，用于把輸入的聲音信號映射成亞抽樣的頻率分量.根據使用的濾波器組的性質(zhì)，即濾波器組在頻域的分辨率的大小，這些頻率分量又可叫做子帶樣值或頻率線(xiàn).

(a) 　　 (b) 　　圖1　感覺(jué)聲音***結構框圖

濾波器的輸出或者與濾波器組并行的時(shí)頻變換的輸出，提供給心理聲學(xué)模型以估計時(shí)間相關(guān)的聲音掩蔽門(mén)限.心理聲學(xué)模型使用了人們所知的同時(shí)掩蔽效應，包括有調音的掩蔽特性和無(wú)調音的掩蔽特性.如果使用聲音的前后掩蔽效應，還可進(jìn)一步提高掩蔽門(mén)限估計的準確性.子帶樣值或頻率線(xiàn)按照盡量保證量化噪聲的頻譜處于掩蔽門(mén)限以下的準則進(jìn)行量化和編碼，這樣能保證被人耳感知的量化引入的噪聲最小.根據對復雜度的要求，可以使用塊壓擴或熵編碼的分析合成方法.

幀打包把量化編碼的輸出和相關(guān)邊信息按照規定的格式組合起來(lái)，以便供***使用.

2　編碼質(zhì)量和DSP速度

單片ADSP-2181實(shí)現MPEG聲音編碼關(guān)鍵需要解決兩個(gè)問(wèn)題：一是如何保證聲音編碼質(zhì)量；其次是如何充分利用DSP的運算速度.而這兩個(gè)問(wèn)題往往又是一對矛盾，需要找到其最佳結合點(diǎn).

一般而言，決定MPEG聲音編碼器的優(yōu)劣主要是聲學(xué)模型的好壞.但是，對于使用單片16bit定點(diǎn)DSP的應用而言，這個(gè)結論就不再適用了.分析表明，此時(shí)有限字長(cháng)效應對編碼質(zhì)量的影響成了主要矛盾.特別是分析濾波器組，截尾效應竟帶來(lái)了33倍于16bitAD轉換量化誤差的噪聲，而窗系數的有限長(cháng)度表示則使本來(lái)高達96dB旁瓣衰減的濾波器響應降低到不到70dB.因此，要保證聲音編碼質(zhì)量，分析濾波器組算法必須進(jìn)行精度擴展.

關(guān)于速度問(wèn)題，首先想到的是使用快速算法，我們也嘗試了在子帶濾波中使用快速算法［4］.
但是，實(shí)踐證明，這些快速算法使用在DSP上效果并不理想，其原因有以下3條：（1）只考慮了加法和乘法的次數，而對附值、尋址等操作毫不關(guān)心，但對所有指令都是單周期的DSP而言，乘法和加法的次數相對其他操作并不顯得特別重要；（2）沒(méi)有考慮DSP的硬件特點(diǎn)，其算法不能充分發(fā)揮DSP的乘累加器（MAC）并行處理的能力；（3）ADSP-2181是為16位算法操作優(yōu)化的，在需要精度擴展的情況下，運算量將以數量級的速度急劇增加.

基于以上質(zhì)量和速度要求的分析，我們選用了適合DSP乘累加指令的多相結構濾波器組實(shí)現方式，且采用基于MAC結構的精度擴展方法，較好地解決了編碼質(zhì)量和DSP速度之間的矛盾.另外，對抽樣數據的輸入方式、心理聲學(xué)模型、比例因子編碼都進(jìn)行了適于A(yíng)DSP-2181的改進(jìn)，減少了運算量，保證了實(shí)時(shí)性.

3　算法的軟件設計

軟件設計是MPEG聲音編碼的單片DSP實(shí)現的核心，編碼質(zhì)量和速度的要求都需要通過(guò)精心設計DSP軟件才能實(shí)現.
(1)基于MAC結構的精度擴展　MPEG聲音編碼的分析濾波器組可以有許多種實(shí)現方式，多相結構是MPEG標準推薦的一種，其數學(xué)表示為

(1)
(2)