TI 全新TMS320C66x 定點(diǎn)與浮點(diǎn)DSP內核成功挑戰速度極限
圖 2 所示的 TI 最新 C66x 內核具有同 C64x+ 內核相同的基本 A B 結構。請注意,.M 單元的 16 位乘法器已增至每個(gè)功能單元 16 個(gè),從而實(shí)現內核原始計算能力提升 4 倍。C66x DSP 實(shí)現的突破性創(chuàng )新使得由 4 個(gè)乘法器組成的各群集可協(xié)同工作以實(shí)施單精度浮點(diǎn)乘法運算。
圖 2 - TI 最新 C66x DSP 內核
C66x DSP 內核可同時(shí)運行多達八項浮點(diǎn)乘法運算,加之高達 1.25 GHz 的時(shí)鐘頻率,使其當之無(wú)愧地成為市場(chǎng)上性能最高的浮點(diǎn) DSP。將多個(gè) C66x DSP 內核進(jìn)行完美整合,即可創(chuàng )建出具有出眾性能的多內核片上系統 (SoC) 設備。
浮點(diǎn)技術(shù)的成本為使定點(diǎn)與浮點(diǎn)組件都能同時(shí)實(shí)現最佳性能,TI 專(zhuān)為該款最新的 C66x 內核開(kāi)發(fā)了全新的浮點(diǎn)與定點(diǎn)指令,所有這些都對實(shí)現高效率的無(wú)線(xiàn)信號處理至關(guān)重要。由于采用浮點(diǎn)符號會(huì )帶來(lái)額外的計算復雜度,從而導致了定點(diǎn)與浮點(diǎn)處理器“分庭抗禮”的局面。在定點(diǎn)運算情況下,加法、乘法等基本操作簡(jiǎn)單易行,但在浮點(diǎn)運算情況下,這些基本操作需要做更多工作量。比如兩個(gè)浮點(diǎn)數相乘的情形:
請注意,指數需要相加操作,尾數則需要相乘操作。然后,最終 (M1×M2) 值需調整成 23 位的表示形式,這可能需要對指數的值也作更改。使用浮點(diǎn)技術(shù)進(jìn)行所有基本運算時(shí)將需要很多額外的操作。
浮點(diǎn)計算帶來(lái)的額外復雜度恰好說(shuō)明了眾多算法僅采用定點(diǎn)表示數和定點(diǎn)運算的原因。嵌入式處理器能夠更快地運行定點(diǎn)運算,并且在眾多情況下,只需要定點(diǎn)算法即可。例如,C66x DSP 內核在每個(gè)周期內都能執行 16 項定點(diǎn)乘法運算或者是 4 項浮點(diǎn)乘法運算。為使定點(diǎn)和浮點(diǎn)組件都能同時(shí)實(shí)現最佳性能,TI 為該款最新的 C66x DSP 內核開(kāi)發(fā)了定點(diǎn)與浮點(diǎn)運算指令,所有這些都對實(shí)現高效率的無(wú)線(xiàn)基站信號處理至關(guān)重要。浮點(diǎn)指令 FPi 包括:
1. 單精度復數乘法
2. 矢量乘法
3. 單精度矢量加減法
4. 單精度浮點(diǎn)-整數之間的矢量變換
5. 支持雙精度浮點(diǎn)算術(shù)運算(加、減、乘、除及與整數間的轉換)并且完全為管線(xiàn)式
最新定點(diǎn)指令可實(shí)現最佳的矢量信號處理 (VSPi),其中包括:
1. 復數矢量和矩陣乘法,諸如針對矢量的 DCMPY,以及針對矩陣乘法的CMATMPYR1
2. 實(shí)矢量乘法
3. 增強型點(diǎn)積計算
4. 矢量加減法
5. 矢量位移
6. 矢量比較
7. 矢量打包與拆包
評論