三重播放時(shí)代需要的基礎設施DSP
語(yǔ)音/數據/媒體網(wǎng)絡(luò )的興起要求高性能與高速 IO 完美結合。本文將探討如何選擇可滿(mǎn)足上述要求的 DSP,提供低成本解決方案
本文引用地址:http://dyxdggzs.com/article/104110.htm多媒體內容隨著(zhù)總流量的增長(cháng)而變得日益豐富,這為設備制造商帶來(lái)了前所未有的工程設計挑戰與機遇。他們必須制造出新一代能夠處理持續急速上升的匯聚流量的設備,該匯聚流量不同于過(guò)去主導基礎局端設計范例的語(yǔ)音與數據流量。
這種變革是上世紀70年代計算機革命以來(lái)的多重趨勢引發(fā)的。
● 從純語(yǔ)音流量到語(yǔ)音與數據流量的轉變。這一趨勢在數十年前就已開(kāi)始了,現在仍在繼續。
● 多媒體流量,特別是流媒體,加入現有的語(yǔ)音與數據流量。電信運營(yíng)商轉向提供語(yǔ)音、視頻與數據服務(wù)的“三重播放業(yè)務(wù)”可充分證實(shí)這一發(fā)展趨勢。
● 從固定地址服務(wù)到家庭服務(wù)再到移動(dòng)服務(wù)的演進(jìn)。有線(xiàn)基礎局端中從語(yǔ)音到數據再到媒體的演進(jìn)現在正在無(wú)線(xiàn)領(lǐng)域悄然進(jìn)行。
● 上述三個(gè)趨勢推動(dòng)了另一趨勢的發(fā)展:從電路交換傳輸到基于數據包的傳輸的演進(jìn),特別是對因特網(wǎng)協(xié)議(IP)流量。
在語(yǔ)音通信時(shí)代,電信信號處理無(wú)非是回聲消除、數據調制解調器的線(xiàn)路調節以及在交換電路上進(jìn)行數據調制/解調的信號處理。目前,對音頻、視頻和數據流進(jìn)行數字編碼/解碼以及壓縮/解壓縮的算法就有數十種之多。簡(jiǎn)言之,電信基礎局端不僅僅是要處理更多的數據,而且要實(shí)現信號處理量的指數級增長(cháng)以實(shí)時(shí)處理大量數據。
顯而易見(jiàn),要實(shí)現信號處理量的指數級增長(cháng)需要大幅提高性能。一種方法是僅加快數字信號處理器(DSP)的時(shí)鐘速度。但這種解決方案不是長(cháng)久之計,主要原因如下:首先,芯片時(shí)鐘速度有限;其次,流量負載呈指數級而非線(xiàn)性增長(cháng),即使在最高時(shí)鐘速度下,也將很快無(wú)法滿(mǎn)足性能要求。另一個(gè)根本問(wèn)題是基礎局端設備采用機架安裝,對尺寸和散熱都有嚴格的要求。在機架尺寸不變(縮小尺寸除外)的情況下,高時(shí)鐘速度帶來(lái)的高散熱最終也會(huì )使僅提高時(shí)鐘速度這一方法不可行。將來(lái),電路板性能的提升會(huì )受到其功耗預算、樓宇的使用年限與位置以及安裝基礎局端設備的機架等的限制。
提高性能
電信設計工程師面臨著(zhù)一個(gè)巨大的挑戰。他們必須在更小的板級空間內提供更出色的性能、增加通道密度、處理日益多樣化的媒體陣列,同時(shí)保持通信的靈活性與低成本特性。
為應對這些挑戰,DSP一直在改進(jìn)。從芯片設計人員的角度,這意味著(zhù)要將上述趨勢轉化為特定的 IC 特性與架構。
同時(shí)實(shí)現高性能與低功耗目標的最佳策略是在低電壓芯片上采用優(yōu)化的處理引擎及高效 I/O 處理盡可能多的數據。
處理不斷增多的原始數據量要求極高的性能與高效的片上數據傳輸能力。從架構上講,這可通過(guò)交換中心資源 (SCR) 連接處理元件(DSP CPU、DSP 外設、協(xié)處理器加速器以及內部存儲器)得以實(shí)現,即具有主從單元的縱橫制架構。例如,德州儀器的TMS320C6455 DSP 采用的就是這種架構,如圖 1 所示。

圖1 TMS320C645x器件結構圖
SCR左邊的任一主單元均可直接與 SCR 右邊的從單元相連。主單元包括 DSP 的 CPU、串行高速 IO (SRIO)、四個(gè)傳輸控制器 (TC)以及將三個(gè)主外設(PCI、HPI 與 EMAC)連接至 SCR 的縱橫制端口。從單元包括 DSP 存儲器、DDR 存儲器接口、Turbo 協(xié)處理器 (TCP)、Viterbi 協(xié)處理器 (VCP) 以及將多個(gè)外設連接至 SCR 的縱橫制端口。
這種架構既快速又高效,因為 SCR 使主從單元之間實(shí)現了真正的同時(shí)數據傳輸。例如,PCI 至 DDR EMIF 的連接獨立于 PCI 166 至 DSP CPU 的連接。數據完全是并行傳輸。當多個(gè)主單元訪(fǎng)問(wèn)同一個(gè)從單元時(shí),SCR 執行判優(yōu)。同時(shí)系統設計人員可以通過(guò)對主單元的優(yōu)先級別進(jìn)行編程來(lái)施加某些控制。
架構要求
在執行算法時(shí),CPU與存儲器之間的指令和數據傳輸至關(guān)重要。在如圖2所示的 TMS320C6455 DSP的存儲器系統中,可通過(guò)使用256位寬的數據總線(xiàn)并在CPU與存儲器之間的內部直接存儲器存取(DMA)架構上創(chuàng )建兩層高速緩存來(lái)優(yōu)化數據傳輸。

圖2 TMS320C64x+內部存儲器
另一個(gè)架構要求是高效片上處理引擎。一種高效的方法是集成片上協(xié)處理器,以加速要求高性能的特定功能。例如,MS320C6455 DSP就集成了Viterbi協(xié)處理器(VCP)與Turbo協(xié)處理器 (TCP),如圖1所示。
片上處理工作完成后,開(kāi)發(fā)人員仍需將大量數據從芯片傳輸至電路板上,最終傳輸到電信傳輸介質(zhì)上。顯然應選擇高速I(mǎi)O,但考慮到上述的異構架構,確定哪種處理方法最佳就會(huì )變得復雜。
最佳解決方案是為片內板級接口提供多種高性能IO接口。SRIO是異構多處理器器件間通信的最佳選擇,因為其高吞吐消息傳遞方案可實(shí)現95%的帶寬利用率(4x 串行雙向鏈路可達10Gb/s)。
當然,外部存儲器傳輸最好采用 32位DDR2存儲器控制器;同樣,連接片外器件最好采用66MHz的PCI總線(xiàn);處理板上或板外IP流量的最好選擇1Gb/s以太網(wǎng)媒體接入控制器 (EMAC);電信專(zhuān)用的通用測試與操作PHY接口則可充分滿(mǎn)足ATM (UTOPIA 2)連接的 需求。
雖然 DSP處理能力隨著(zhù)具有更強并行能力以及其他高級特性的新架構的推出而顯著(zhù)提高,但電路板設計人員還可通過(guò)將多個(gè)DSP高效集成到單個(gè)電路板來(lái)獲取更明顯的改善。使用 SRIO 快速連接大大簡(jiǎn)化了這項工作,因為從DSP軟件的角度,DSP之間的數據流處理與單個(gè)DSP內的數據流處理并沒(méi)有很大的差異。
板級性能
在傳統系統中,語(yǔ)音與數據流量是分開(kāi)的,這導致了效率低下。隨著(zhù)時(shí)間或其他一些影響流量配置的參數的變化,可能會(huì )出現處理能力與帶寬的閑置。利用新一代架構,設計人員能夠設計出在單個(gè)器件上更高效處理所有流量的系統。
這種融合解決方案的范例之一是Surf公司的SurfRider產(chǎn)品系列。該產(chǎn)品系列針對可優(yōu)化的低成本電路板提供軟硬件,以滿(mǎn)足特定系統流量要求。
SurfRider/AMC可在單個(gè)電路板上集成多達8個(gè)DSP,并可實(shí)現高達10Gb/s吞吐能力。在單個(gè)高級電信計算架構 (ATCA)或MicroTCA機架上可安裝8個(gè)電路板。
發(fā)展無(wú)止境
通過(guò)在DSP內部增加并行處理功能,并使用DSP、片外存儲器及其他組件之間的超高速互連,芯片設計人員可設計出新一代基礎局端電路板和網(wǎng)關(guān)系統。這些系統使電信營(yíng)運商不僅能夠同時(shí)提供三重播放業(yè)務(wù)服務(wù),而且還可靈活適應流量類(lèi)型和負載的變化。
發(fā)展永無(wú)止境。過(guò)去數年的進(jìn)展令人難忘,不過(guò)不會(huì )止步于此。一些新的設計戰略已相當明了,如集成更多片上協(xié)處理器和增加并行設計。但芯片和電路板設計人員也認識到嵌入多個(gè)DSP的電路板的成本仍然不菲。
在單個(gè)芯片上集成多個(gè)DSP內核的做法正在悄然興起。除了成本低于多個(gè)獨立封裝的DSP 外,多核DSP還具有其他優(yōu)勢。共享內存的多個(gè)內核可以在較低時(shí)鐘頻率和電壓下運行,以降低每通道的功耗。這對多通道分組語(yǔ)音流量尤其適用,因為其要求的處理能力和內存帶寬低于視頻要求。
多核還為蜂窩基礎設施以及正在興起的WiMAX應用帶來(lái)了獨特機遇。這是因為無(wú)線(xiàn)傳輸需要先進(jìn)的OFDM調制解調器。這類(lèi)調制解調器的工作負載不僅要求多核DSP以更高速度運行(1GHz,而VoIP MP為500MHz),而且還要求出色的硬件加速能力并具備如 Turbocore和Viterbi這樣的協(xié)處理器。功耗限制也會(huì )降低每芯片的內核數量。
隨著(zhù)電信行業(yè)邁入三重播放業(yè)務(wù)時(shí)代,其面臨著(zhù)幾年前可能還無(wú)法解決的工程設計挑戰。對性能的要求無(wú)疑會(huì )繼續提高,但設計人員增強創(chuàng )新型DSP芯片性能的能力會(huì )隨著(zhù)多核和基于DSP的SoC的興起而提高,使DSP能夠解決以前在系統性能、功耗、靈活性以及單通道價(jià)格等方面的難題。
評論