量身訂制的DSP元件設計策略
省電技術(shù)
DSP供應商有許多技術(shù)可以用來(lái)降低功耗,并且達成效能目標,包括:
●選擇適當制程;
●電晶體設計技術(shù);
●選擇正確的操作頻率和電壓;
●採用散熱效率很高的封裝,確保元件保持在特定操作溫度范圍內。
功耗來(lái)源
無(wú)論應用為何,元件功耗都包含下面幾種來(lái)源:
漏電功耗(leakage power)
元件的漏電功耗為固定值,不受處理器動(dòng)作或操作頻率影響,但會(huì )隨著(zhù)制程、操作電壓和溫度而改變。低精密度(low geometry)制程的漏電功耗多半會(huì )跟著(zhù)電壓和溫度而呈指數增加。
時(shí)脈功耗(clocking power)
元件的時(shí)脈功耗與時(shí)脈頻率成正比。高整合度元件的晶片面積多半用于記憶體或暫存器等同步組件,如果時(shí)脈架構設計不良,那么無(wú)論元件實(shí)際工作量多寡,其功耗都會(huì )保持不變。
操作功耗(active power)
與元件當時(shí)所執行的實(shí)際系統功能有關(guān)。
除了上述來(lái)源之外,元件功耗還會(huì )受到兩大因素影響:
元件電流
元件電流越高,電池電力的消耗速度就越快,有時(shí)還會(huì )超出功率預算范圍而導致供應電壓下降,使元件脫離正常操作區而造成錯誤。
元件/系統溫度升高
元件若無(wú)法有效散熱,其溫度就可能超出額定范圍而造成操作錯誤。
下列最佳化技術(shù)會(huì )以不同方式解決前述各種功耗問(wèn)題。
選擇適當制程
為了使不同應用的效能和功耗達到最佳化,德州儀器(TI)能提供各種制程類(lèi)型,例如TI的130奈米低漏電制程在1.5V操作時(shí)幾乎沒(méi)有漏電流,對于DSP多半處于閑置狀態(tài)的可攜式應用而言,這種低漏電制程就能幫助它們節省功耗。另一種高效能制程的漏電流較大,卻能在1.2V下操作,採用該制程的元件可以達到低漏電制程的兩倍MHz效能。在較重視最大操作功耗(fully-active power)的基礎設施應用里,這種高效能制程的競爭力還勝過(guò)低漏電制程,原因有兩點(diǎn):首先,低漏電運算處理單元的操作頻率只有高效能制程的一半,這表示其數量必須加倍才能提供同樣效能,但這會(huì )導致元件成本提高。其次,由于功耗與電壓平方成正比,故在其他條件相同的情形下,高效能制程的操作功耗只有低漏電制程的(1.2V/1.5V)2或是64%。由于低操作功耗對于基礎設施應用的重要性通常會(huì )超過(guò)低漏電功耗,因此高效能制程就成為這類(lèi)應用的最佳選擇。
電晶體設計
同樣制程的電晶體也可以有不同的開(kāi)關(guān)臨界電壓(VT),例如低VT電晶體的切換速度較快,高VT電晶體的漏電流則較小,晶片只需在會(huì )影響速度的部份使用低VT電晶體,其它電路則採用高VT電晶體以節省電力。設計人員的元件資料庫應包含高VT和低VT電晶體所構成的基本邏輯閘(NAND、NOR和INVERT等),他們有時(shí)還會(huì )使用中間臨界電壓(middle-VT)的電晶體。一般說(shuō)來(lái),除非為了滿(mǎn)足重要的效能要求,否則應盡量使用高VT電晶體組成的邏輯閘。
元件操作點(diǎn):電壓和頻率
數種元件時(shí)脈供應方式可以節省功耗:
●多時(shí)脈域(multiple clock domain);
●動(dòng)態(tài)頻率調整(dynamic frequency scaling);
●時(shí)脈閘控(clock gating)。
除了時(shí)脈,調整電壓也能降低功耗:
●靜態(tài)電壓調整;
●動(dòng)態(tài)電壓/頻率調整;
●多電壓域(multiple voltage domain)。
多時(shí)脈域
時(shí)脈域是元件中使用同一個(gè)時(shí)脈頻率的部份。將晶片電路分成多個(gè)時(shí)脈域可以讓每個(gè)部份以最適當的速度操作,進(jìn)而節省電力。例如高效能DSP可能需要以1GHz操作,但連接至立體聲編碼解碼器界面的串列埠卻只需12MHz的速度。雖然多時(shí)脈域設計還需要同步電路和橋接電路讓訊號跨越不同的時(shí)脈域,其能大幅降低整體功耗。
頻率調整
元件的某些時(shí)脈域在不同時(shí)間可能會(huì )有不同的操作需求,例如處理器若在某段時(shí)間只有10%的運算需求,那么將時(shí)脈頻率減為平常的1/10就能大幅降低時(shí)脈功耗。動(dòng)態(tài)時(shí)脈調整電路的設計必須非常小心,以確保同步邏輯電路收到穩定而不會(huì )跳動(dòng)的最小負載週期時(shí)脈。頻率調整對于使用電池的應用最有幫助。
時(shí)脈閘控
時(shí)脈閘控會(huì )切斷閑置電路的時(shí)脈,其中又以睡眠模式的做法最簡(jiǎn)單,它讓使用者利用軟體關(guān)掉晶片部份電路。其它技術(shù)則自動(dòng)將元件某些部份的時(shí)脈關(guān)掉,直到有需要時(shí)再啟動(dòng),例如乙太網(wǎng)路的媒體存取控制器(MAC)平??商幱谒吣J?,等到它偵測到網(wǎng)路后才開(kāi)始工作。時(shí)脈閘控也和頻率調整一樣適合所有使用電池的應用。
靜態(tài)電壓調整
若應用的效能需求較低,元件也可在較低電壓下操作。舉例來(lái)說(shuō),若DSP是在1.2V電壓下以720 MHz速率工作,它也能使用1.1V電壓并以600MHz頻率操作。由于功耗與電壓平方成正比,在1.1V電壓下以600MHz速率操作的功耗只有720MHz功耗的(1.1V/1.2V)2,大約是84%左右。另外,操作功耗也會(huì )因為時(shí)脈頻率降低而減少兩成。
動(dòng)態(tài)電壓/頻率調整
這種技術(shù)讓電壓隨著(zhù)頻率而減少以進(jìn)一步節省功耗。頻率的切換同樣必須非常小心,元件應先將時(shí)脈切斷,然后才改變操作電壓。動(dòng)態(tài)電壓
/頻率調整技術(shù)非常適合可攜式應用。
電壓域
多域的觀(guān)念同樣適用于電壓,設計人員可以根據效能需求將晶片分成多個(gè)部份,而每個(gè)部份使用不同的電壓。由于不同的電壓域必須以隔離電路分開(kāi),保護它們不受其它電壓域的損害,因此這種技術(shù)用于設計時(shí)必須相當謹慎。它們還必須提供轉換電路,用來(lái)轉換跨越不同電壓域的訊號。多電壓域需要多組電源,然而晶片內建穩壓器的效率通常都比不上電路板層級的電源供應器,因此這類(lèi)設計多半需要由電路板供應多組電源,這正是多電壓域技術(shù)的缺點(diǎn)之一:因為電路板需要增加多個(gè)電源層,使得設計復雜性大幅提升。
電源閘控(power supply gating)
電源閘控又比時(shí)脈閘控技術(shù)更進(jìn)一步,它會(huì )直接切斷晶片閑置電路的電源。由于這種技術(shù)更復雜,又需要隔離電路,因此通常會(huì )用于比時(shí)脈閘控技術(shù)(以個(gè)別電路為單位)還大的范圍(多半以模組為單位)。這種技術(shù)和多電壓域技術(shù)也有所不同,其隔離電路會(huì )內建于晶片,避免增加電路板設計的復雜性。
操作點(diǎn)技術(shù)的應用范圍
上述技術(shù)是否有用,端賴(lài)使用者是根據電池壽命或最大功耗來(lái)評斷應用系統的優(yōu)劣。某些技術(shù)幾乎對所有應用都有幫助,例如多時(shí)脈域和多電壓域技術(shù)只需用到時(shí)脈頻率和電壓,所以任何應用系統都可以?huà)裼眠@兩種技術(shù)。域的數目只會(huì )受到這些技術(shù)所帶來(lái)的設計復雜性限制,多電壓域還可能受到電路板復雜性的影響。同樣地,多數元件的電路并非都是在最大負載條件下操作,因此時(shí)脈閘控技術(shù)(尤其採用自動(dòng)控制方式的技術(shù))在許多應用都能發(fā)揮作用。靜態(tài)電壓調整對所有應用都有好處,因為元件只會(huì )在提供所需效能的必要電壓下操作。
應用系統若以電池為電源,并提供多種操作模式,那么頻率調整和動(dòng)態(tài)電壓/頻率調整技術(shù)就能發(fā)揮最大作用;另一方面,這些方法對于重視最大功耗的應用卻沒(méi)有太大用處。除此之外,電源閘控對于這些類(lèi)似于基礎設施的應用可能也沒(méi)有幫助,因為這類(lèi)應用的元件很少會(huì )有大片電路處于閑置狀態(tài)。
選擇適當架構
調整應用功耗的另一種做法是選擇最適當的功能整合度、運算處理單元和記憶體架構。
週邊和記憶體的整合
元件和外部零件需要透過(guò)電路板互傳訊號,有可能是系統功耗的主要來(lái)源,因為經(jīng)由電路板傳送訊號需要比晶片功能整合還高的電壓,電路板訊號線(xiàn)的寄生電容也會(huì )造成功耗。
運算處理單元的調整
以系統單晶片為主的現代元件可以選擇不同類(lèi)型的運算處理單元:
DSP
專(zhuān)門(mén)執行訊號和影像處理演算法的處理器,內建多組應用最佳化硬體運算邏輯單元和乘法器,能以極高效率執行標準訊號處理演算法。這類(lèi)元件具備完整的可程式能力,可以輕松支援未來(lái)出現的新標準。
通用處理器
ARM處理器就是例子,其主要用來(lái)執行一般性功能,例如圖形化使用者界面、網(wǎng)路堆疊(network stack)和整體系統控制。由于它們不必整合DSP功能所需的運算處理單元,所以執行一般性功能時(shí)功耗就比較小。
特殊用途硬體協(xié)同處理器
只包含特定功能所需的算術(shù)單元和控制電路。如果應用功能的定義很明確,又不太可能改變,即可將該功能整合到硬體協(xié)同處理器。舉例來(lái)說(shuō),整合了Viterbi和Turbo處理器的DSP,便可專(zhuān)門(mén)執行3G基地臺標準所要求的前向錯誤更正(FEC)。
今日的系統單晶片多半會(huì )整合前述多種運算處理單元。有些架構會(huì )採用多種不同類(lèi)型的運算處理單元,然后將不同的功能交給最適當的核心執行。DSP可以高效率執行訊號處理,RISC則適合處理系統控制和使用者界面等工作。由于每個(gè)運算處理單元都以實(shí)際所需的速度執行最擅長(cháng)的工作,故能將功耗減至最??;相形之下,若只用一個(gè)運算處理單元執行所有功能,其時(shí)脈頻率就必須更高,同時(shí)還要包含更多硬體,其中有些部份可能經(jīng)常處于閑置狀態(tài)。換言之,這類(lèi)設計的工作效率必然較低,而在工作效率就等于電源效率的情形下,其功耗必然更高。
記憶體系統的選擇
元件若想避免存取外部記憶體,也可將應用所需的記憶體全部整合至晶片內。然而視訊或影像系統之類(lèi)的應用卻需要極為龐大的記憶體,將它們全部整合至晶片所需的成本可能遠超過(guò)直接在電路板上增加DRAM的費用。這類(lèi)應用可以利用快取架構來(lái)減少外部記憶體的存取次數,進(jìn)行降低系統總功耗。
就算元件包含全部所需的記憶體,快取也能幫助它們降低功耗。這類(lèi)元件可以將少量的第一層快取記憶體直接連線(xiàn)到處理器,使其儲存主記憶體中最常用的內容。主記憶體則是第二層記憶體,其速度通常較慢,所用的記憶體方塊也比第一層快取更省電。由于處理器的多數存取動(dòng)作都會(huì )命中第一層快取記憶體,這些記憶體又採用電容值較小的結構,所以每次存取動(dòng)作的功耗就變得更低。
封裝與功耗
前述所有省電技術(shù)都能幫助元件減少產(chǎn)生熱量,封裝則能透過(guò)高效率散熱進(jìn)一步加強它們的效果。傳統的風(fēng)扇、散熱空間或
散熱片都不適合空間有限的可攜式應用,它們的高度或成本也可能超過(guò)插入式模組或汽車(chē)應用所能接受的范圍;相形之下,金屬散熱蓋或散熱層雖會(huì )增加元件成本,卻能提供更高散熱效率。有些元件還將散熱錫球連接到元件的散熱接地面,由它透過(guò)電路板來(lái)達成更良好的散熱效果。
選擇適當技術(shù)
電池供電型應用
可攜式或掌上型應用最重視電池壽命,但可攜式應用使用電池的方式卻有極大差異??蓴y式產(chǎn)品有許多不同的操作模式,設計人員必須將這些模式列入考慮才能讓電池享有最長(cháng)壽命。
MP3播放機
由于歌曲下載時(shí)間只佔播放少部份的時(shí)間,這類(lèi)產(chǎn)品的電力多半用于歌曲播放。為了將待機功耗減到最少,它們還會(huì )在一段時(shí)間后自動(dòng)關(guān)機。MP3播放機必須將音樂(lè )即時(shí)解壓縮,避免資料流失造成各種雜音。MP3播放機的效能需求遠小于視訊處理或寬頻通訊等其它應用,所以最適合使用低功耗DSP。這類(lèi)元件通常會(huì )採用低漏電制程,因為漏電仍是主要功耗來(lái)源。它們還能採用頻率調整技術(shù),以便根據歌曲所需的解碼效能來(lái)降低元件的時(shí)脈頻率。
數位相機
這類(lèi)產(chǎn)品有多種操作模式,包括:
(1)自動(dòng)關(guān)機的待機模式;
(2)預視模式(等待拍攝相片);
(3)拍照模式(實(shí)際拍攝相片以及處理和壓縮影像);
(4)錄影模式(部份相機具備此功能)。
數位相機的螢幕有時(shí)會(huì )開(kāi)啟很長(cháng)的時(shí)間,但DSP真正執行影像壓縮的時(shí)間卻很短。數位相機在預視模式和拍攝模式都必須執行許多即時(shí)處理作業(yè),在預視模式必須不斷顯示最新畫(huà)面,在拍攝模式則要盡快完成相片的處理和壓縮,以便繼續拍攝下一張照片,進(jìn)而將兩次拍攝之間的延遲時(shí)間縮到最短。這種DSP包含多種不同的運算處理單元:
●ARM7核心,負責系統控制功能和使用者界面;
●TMS320C54x處理器;
●SIMD影像處理引擎(iMX),提供可程式影像處理功能;
●可變長(cháng)度編碼和解碼(VLC/VLD)協(xié)同處理器,負責影像和視訊的壓縮與解壓縮;
●預視引擎,即時(shí)顯示預視畫(huà)面以及數位變焦。
它還具備很高的功能整合度,可以縮小產(chǎn)品體積和減少系統功耗:
●多用途的OSD功能;
●彩色液晶螢幕的數位界面;
●CompactFlash、SmartMedia、Secure Digital以及Memory Stick記憶卡界面;
●多通道10位元數位類(lèi)比轉換器,負責提供NTSC/PAL復合視訊輸出;
●多通道串列音訊Codec界面(McBSP);
●晶片內建USB 1.1功能控制器。
這類(lèi)裝置可以選定某些很少使用的功能,然后在它們處于閑置狀態(tài)時(shí)切斷時(shí)脈訊號。舉例來(lái)說(shuō),預視和待機模式可能不需要iMX和VLD/VLC功能方塊,相機未連接至個(gè)人電腦時(shí)則可將USB界面的電源關(guān)掉。
行動(dòng)電話(huà)
標準行動(dòng)電話(huà)有兩種電源模式:
(1)等待電話(huà)的待機模式;
(2)實(shí)際撥打電話(huà)的通話(huà)模式。
處于待機模式時(shí),數據機功能(在等待電話(huà)時(shí))會(huì )以低功耗模式操作,應用功能(數位語(yǔ)音編碼和解碼)的電源則可完全切斷。手機進(jìn)入通話(huà)模式后,數據機功能和應用功能就會(huì )在功耗較高的模式下操作。低耗電制程已能滿(mǎn)足這類(lèi)手機的處理需求,因此許多產(chǎn)品都採用這種制程以節省電力,此時(shí)產(chǎn)品凈功耗與每種模式所佔用的時(shí)間有關(guān)。它們還能使用電壓和頻率調整技術(shù),以便根據操作模式的作業(yè)需求來(lái)調整元件功耗。先進(jìn)手機還增加數位相機、MP3和錄影功能,所以其操作模式也變得更多。為了支援這些操作模式,行動(dòng)電話(huà)通常會(huì )採用不同類(lèi)型處理器所組成的異質(zhì)架構,由DSP和各個(gè)操作模式專(zhuān)用的硬體加速器來(lái)執行數據機和相機等應用所需的訊號處理功能,再由DSP搭配負責使用者界面和系統控制功能的RISC處理器。如果某個(gè)模式不會(huì )用到加速器功能,系統也可切斷它們的電壓或時(shí)脈,例如待機模式不需要使用者界面時(shí),可將RISC核心的電源關(guān)機。
可攜式應用會(huì )視需要採取各種省電技術(shù),以便將重要操作模式的功耗減到最低。
基礎設施系統
封包語(yǔ)音(VoIP)或基地臺收發(fā)器等設備所用的無(wú)線(xiàn)和有線(xiàn)基礎設施雖屬于「插入式」應用,卻仍須在不同的功耗限制下操作。有些系統會(huì )在電源供應和系統散熱能力已經(jīng)固定的機架上,增加新的功能單元或通道容量,這些系統通常必須在室內空調系統故障時(shí)繼續正常操作。每個(gè)機架的總功耗都不能超過(guò)現有電源供應的供電能力,電源供應會(huì )將電源提供給機架上的電路板,每張電路板再將電源分配給電路板上的不同元件。隨著(zhù)半導體元件日益精密,晶片還能提高操作頻率或內建多顆DSP處理器來(lái)支援更多通道。另一方面,不斷縮小的電路結構卻讓晶片產(chǎn)生更多功耗,因此透過(guò)封裝提高散熱效率也變得更重要。由于這些系統必須非??煽?,所以在分析其電源和散熱需求時(shí),應將所有處理器都在最大負載下
工作的情況列入考慮。
為了降低滿(mǎn)負載的操作功耗,這類(lèi)系統多半會(huì )採用在較低電壓下操作的高效能制程,并且搭配對于任何應用都有幫助的多時(shí)脈域和時(shí)脈閘控技術(shù)。這些系統不會(huì )利用多電壓域技術(shù)降低功耗,因其包含大量而密集的處理器,此時(shí)若採用多電壓域技術(shù)會(huì )造成電路板設計復雜性大幅增加。靜態(tài)電壓調整有助于節省功耗,由于功耗會(huì )隨著(zhù)操作電壓的平方而改變,所以這些設計會(huì )選擇較低的操作電壓。這些元件還能整合更多核心,以彌補某些核心在較低頻率下操作所不足的效能,例如與其使用四個(gè)在1.2V下操作的300MHz核心,還不如使用6個(gè)在1.0 V下操作的200MHz核心,因為兩種解決方案的MHz效能(和通道處理能力)都是1200MHz,但后者功耗卻只有前者的(1.0V/1.2V)2,大約是69%。這些元件的晶片面積大都用于內建記憶體,其中又以資料記憶體為主。由于在特定的通道處理密度下,每顆晶片所需的資料記憶體也是定值,而且其中多數記憶體又會(huì )直接分配給各個(gè)核心使用,所以增加核心并不會(huì )造成晶片總面積等比例增加,所帶來(lái)的低功耗優(yōu)點(diǎn)則足以彌補額外增加的成本。
功耗最佳化必須符合應用需求
不同的DSP應用設備需要不同的策略來(lái)滿(mǎn)足其需求,例如基礎設施系統希望降低最大負載條件下的功耗,可攜式應用則希望將電池的電力消耗減至最少,它們的需求顯然就有極大差異。事實(shí)上,就算同類(lèi)型的應用都可能有著(zhù)極為不同的要求,例如不同的可攜式應用必須採取不同的電源最佳化技術(shù)來(lái)滿(mǎn)足各自的操作需求。半導體廠(chǎng)商想要服務(wù)各種市場(chǎng),就必須掌握多種制程、設計和架構技術(shù),才能針對目標應用提供最合適的元件。
評論