利用Virtex-5 FPGA 降低功耗
全球首款65納米 FPGA在不影響性能的同時(shí)實(shí)現最低功耗
作者:Derek Curd
Xilinx公司高級產(chǎn)品部
高級應用工程師
VirtexTM-5 系列產(chǎn)品的推出,使得 Xilinx 公司再一次成為向 FPGA 客戶(hù)提供新技術(shù)和能力的主導力量。過(guò)渡至 65 納米工藝的 FPGA 具備采用更小尺寸工藝所帶來(lái)的傳統優(yōu)勢:低成本、高性能和更強的邏輯能力。盡管這些優(yōu)勢能夠為高級系統設計帶來(lái)激動(dòng)人心的機會(huì ),但65納米工藝節點(diǎn)本身也帶來(lái)了新的挑戰。
例如,在為產(chǎn)品選擇 FPGA 時(shí),功耗的考慮變得越來(lái)越重要。很可能下一代設計會(huì )需要在功耗預算不變(或更?。┑那闆r下,集成更多的特性和實(shí)現更高的性能。
在本文中,我將分析功耗降低所帶來(lái)的好處。還將介紹 Virtex-5 器件中所使用的多種技術(shù)和結構上的革新,它們能提供功耗最低的解決方案,并且不會(huì )在性能上有任何折扣。
降低功耗的好處
低功耗的 FPGA 設計所帶來(lái)的優(yōu)勢不僅是能滿(mǎn)足器件工作的散熱要求。雖然滿(mǎn)足元件指標對于性能和可靠性十分重要,但如何實(shí)現這一點(diǎn)對于系統成本和復雜性都有著(zhù)巨大的影響。
首先,降低 FPGA 的功耗使你能夠使用更便宜的電源,這樣的電源使用的元件數量較少,并且占用的 PCB 面積也較小。高性能的電源系統的成本通常為每瓦0.5到1美元。低功耗的 FPGA 直接降低了系統的整體成本。
其次,由于功耗直接與散熱相關(guān),低功耗使你能夠使用更簡(jiǎn)單、更便宜的熱量管理解決方案。在很多情況下,設計者將不再需要散熱器,或者只需要更小、更便宜的散熱器。
最后,由于低功耗工作意味著(zhù)更少的元件和更低的器件溫度,因此將提高整個(gè)系統的可靠性。器件工作溫度每降低10℃,就相當于元件壽命提高了兩倍,因此對于需要高可靠性的系統而言,控制功耗和溫度十分重要。
功耗:挑戰和解決方案
FPGA (或任何半導體器件)中的總功耗等于靜態(tài)功耗和動(dòng)態(tài)功耗之和。靜態(tài)功耗主要由晶體管的泄漏電流引起,即晶體管即使在邏輯上被關(guān)斷時(shí),從源極“泄漏”到漏極或通過(guò)柵氧“泄漏”的小電流。動(dòng)態(tài)功耗是器件核心或 I/O 在開(kāi)關(guān)過(guò)程中消耗的能量,與頻率相關(guān)。
圖1:85℃時(shí)的靜態(tài)功耗比較
靜態(tài)功耗
在縮小晶體管尺寸時(shí)(例如,從90納米到65納米),泄漏電流將會(huì )增大。新工藝結點(diǎn)所使用的短溝長(cháng)和薄柵氧使電流更容易從晶體管的溝道區或通過(guò)柵氧泄漏。
在90納米 Virtex-4 系列產(chǎn)品中,Xilinx 公司使用了“三柵極氧化層”的工藝技術(shù),向 Xilinx 電路設計者提供了一種強有力的阻止漏電工具。在前幾代 FPGA 中,使用兩種柵氧厚度:薄柵氧用于 FPGA 核心中高性能、低工作電壓的晶體管,而厚柵氧用于 I/O 模塊中尺寸較大,需要承受大電壓的晶體管。簡(jiǎn)單地來(lái)說(shuō),“三柵極氧化層”指增加一種中間厚度柵氧的晶體管,它的漏電比薄柵氧的核心晶體管要小得多。
“中間柵氧”的晶體管用在器件核心外圍非關(guān)鍵性能的電路(像設置存儲器)或不需要對變化的柵壓進(jìn)行快速開(kāi)關(guān)響應的電路(像傳輸門(mén))中。薄柵氧、漏電最大的晶體管只保留在需要快速開(kāi)關(guān)速度的路徑部分。結果,總的器件漏電被大大減小,同時(shí)性能仍能比上一代 FPGA 有很大提高。
三柵極氧化層工藝使 Virtex-4 器件比競爭性90納米 FPGA 在靜態(tài)功耗上平均減少了超過(guò)70%。這一結果非常成功,因此 Virtex-5 系列產(chǎn)品中大量使用了這一技術(shù),在65納米工藝結點(diǎn)上降低漏電。
雖然業(yè)界預測65納米器件的靜態(tài)功耗將會(huì )有大幅度提高,但是圖1顯示了三柵極氧化層工藝使65納米 Virtex器件在最壞(溫度最高)工作條件下達到了與尺寸相當的90納米 Virtex-4器件相同水平的靜態(tài)功耗。因此,Virtex-5 系列產(chǎn)品和競爭性高性能 FPGA 產(chǎn)品相比,在靜態(tài)功耗方面具有真正的優(yōu)勢。
動(dòng)態(tài)功耗
動(dòng)態(tài)功耗為65納米 FPGA帶來(lái)一些其它方面的挑戰。動(dòng)態(tài)功耗的公式為:
動(dòng)態(tài)功耗 = CV2f
其中C是結點(diǎn)開(kāi)關(guān)時(shí)的電容,V是電源電壓,f是開(kāi)關(guān)頻率。65納米工藝節點(diǎn)使 FPGA 的邏輯能力和性能比傳統器件有了顯著(zhù)提高,也就是說(shuō)更多的結點(diǎn)工作在更高的頻率上。如果其它方面的條件不變,動(dòng)態(tài)功耗將會(huì )增大。
但是,對于65納米工藝節點(diǎn)的動(dòng)態(tài)功耗而言,也有一個(gè)好消息:FPGA 核心的電源電壓(V)和結點(diǎn)電容(C)通常在每一代新工藝中都會(huì )下降,從而使得動(dòng)態(tài)功耗比上一代 FPGA 有所下降。
Virtex-5 器件中,核心電源電壓(VCCINT)從Virtex-4 中所使用的1.2V下降到1.0V。由于寄生電容變?。ㄅc更小的晶體管相關(guān)),以及邏輯塊間的互聯(lián)線(xiàn)長(cháng)度變短、電容變小,使結點(diǎn)電容減小。此外,Virtex-5 器件在金屬互聯(lián)層之間使用了一種介電常數較低的材料。
Virtex-5 器件的平均結點(diǎn)電容比Virtex-4 器件大約減小了15%。加上電壓降低帶來(lái)的好處,至少相當于將 Virtex-5 器件的核心動(dòng)態(tài)功耗降低了35-40%。
除“工藝尺寸縮小”到65納米所帶來(lái)的固有的35-40%的動(dòng)態(tài)功耗降低外,Virtex-5 器件的架構創(chuàng )新,還能進(jìn)一步降低每個(gè)設計的功耗。大多數可增加動(dòng)態(tài)功耗有的結點(diǎn)電容,是由邏輯功能間的互連線(xiàn)引起的。新型 Virtex-5 架構在兩個(gè)方面從根本上減小了連線(xiàn)電容:
Virtex-5的可配置邏輯模塊(CLB) 是基于6輸入查找表(6-LUT) 邏輯結構的,在以前的器件中是使用4輸入查找表。這意味著(zhù)在每個(gè) LUT 中能夠實(shí)現更多的邏輯,相當于較少的邏輯級,從而降低了對邏輯功能之間大電容連線(xiàn)的需求。
Virtex-5 的互聯(lián)結構目前包括了對角線(xiàn)對稱(chēng)的連線(xiàn),意味著(zhù)每個(gè) CLB 與所有相鄰的模塊(包括處于對角線(xiàn)位置的模塊)之間都有直接的“單一”連接。當邏輯功能之間需要連接時(shí),這一連接更有可能成為總電容最小的“單一”連接,而以往的互聯(lián)結構對于相同的連接問(wèn)題可能會(huì )需要兩個(gè)或更多結點(diǎn)。
圖2: 計數器標準設計的動(dòng)態(tài)功耗比較
6-LUT 結構和改進(jìn)的互聯(lián)模式,通過(guò)降低平均結點(diǎn)電容來(lái)降低核心的動(dòng)態(tài)功耗,效果遠遠超過(guò)僅使用65納米工藝所帶來(lái)的改進(jìn)。圖2顯示了來(lái)自標準設計的核心動(dòng)態(tài)功耗的測量結果,其中每個(gè) Virtex-5 器件和 Virtex-4 器件中都有1024個(gè)8位計數器。這些實(shí)際的測量結果顯示,工藝和結構上的共同優(yōu)化所帶來(lái)的動(dòng)態(tài)功耗的降低超過(guò)了50%。
硬IP模塊
Virtex-5器件中包含的硬IP模塊(專(zhuān)門(mén)用來(lái)實(shí)現一些常用功能的電路)的數量,超過(guò)業(yè)界其他任何一款 FPGA。相比使用通用 FPGA 邏輯而言,使用搭載這些模塊的 FPGA 設計來(lái)實(shí)現這些功能,可進(jìn)一步降低功耗。
與 FPGA 結構不同,這些專(zhuān)用的模塊中只有實(shí)現所要求的功能必需的晶體管。并且沒(méi)有可編程的互聯(lián),因此互聯(lián)電容最小。較少的晶體管和較小的結點(diǎn)電容能降低靜態(tài)和動(dòng)態(tài)功耗。從而使這些專(zhuān)用模塊在實(shí)現相同功能的同時(shí),功耗只有使用通用 FPGA 結構的十分之一。
除增加新型的專(zhuān)用模塊外,Virtex-4 器件中融合的很多模塊,在 Virtex-5 器件中都被重新設計,以增加新的特性,提高性能,降低功耗。例如,Virtex-4 系列中18-Kb 的 block RAM 存儲器在 Virtex-5 器件中被增加到了36-Kb;每個(gè) block RAM 能被分成兩個(gè)獨立的 18-Kb 的存儲器,以便向下兼容 Virtex-4 的設計。
有趣的是,從功耗的角度來(lái)看,每個(gè) 18-Kb 的子模塊由兩個(gè) 9-Kb 的物理存儲陣列構成。對于大多數的 block RAM 配置,任何對于 block RAM的讀寫(xiě)請求一次只需要訪(fǎng)問(wèn) 9-Kb 物理存儲器中的一個(gè)。因此其余的 9-Kb 存儲器能在不被訪(fǎng)問(wèn)時(shí)被有效地“關(guān)斷”。在過(guò)渡至65納米工藝所帶來(lái)的功耗降低的基礎上,這種結構又使功耗進(jìn)一步降低了50%。這一對于9-kB 模塊的“乒乓”訪(fǎng)問(wèn)是新的 block RAM結構所固有的,這就意味著(zhù)使用這項功能不需要用戶(hù)或軟件來(lái)進(jìn)行控制。它能動(dòng)態(tài)并自動(dòng)地進(jìn)行,使所有使用 block RAM的設計降低了大量的功耗,并且不會(huì )影響模塊的性能。
Virtex-5 器件中專(zhuān)用的 DSP 元件也進(jìn)行了大量的改進(jìn),以實(shí)現更多的功能,提高性能,并降低功耗。在片與片的比較中,新型的 Virtex-5 DSP 片的功耗比 Virtex-4 DSP 片的功耗降低了大約40%。這主要歸功于前面所討論的65納米工藝中電壓和電容的減小。
然而,由于 Virtex-5 DSP 片具有更強的功能和更廣泛的接口,許多 DSP 運算通過(guò)利用這些附加的功能進(jìn)一步降低了功耗。在許多情況下,當使用新型 DSP 片的全部功能時(shí),總功耗最高可降低75%。請記住即使你不是在設計一個(gè) DSP 產(chǎn)品,也能使用 DSP 片來(lái)實(shí)現標準的邏輯功能(計數器、加法器、桶式移位器),這樣會(huì )比在標準 FPGA 邏輯中實(shí)現同樣的功能節省功耗。
最后介紹的經(jīng)過(guò)改進(jìn)的專(zhuān)用模塊是 Virtex-5 系列的 LXT 平臺,其中包括了幾吉位的串行收發(fā)機,能以高達 3.125Gbps 的速率工作。這些 “SERDES” 模塊在實(shí)現時(shí)著(zhù)重考慮了低功耗需求。每個(gè) Virtex-5 LXT 器件中的全雙工收發(fā)機在 3.125Gbps 的速度下的總功耗小于100毫瓦,與Virtex-4串行收發(fā)機相比降低了大約75%。
圖3:典型設計中現有 FPGA 的功耗比較
結論
Xilinx 公司悠久的創(chuàng )新歷史能夠追溯到20多年前第一塊 FPGA 的發(fā)明。因此 Xilinx 公司理所當然地成為第一家在深亞微米技術(shù)中將降低功耗作為首要任務(wù)的公司。與 Virtex-4 系列產(chǎn)品一樣,Virtex-5 器件也采用了一系列工藝和架構上的革新,力求在提供盡可能低的功耗的同時(shí),仍然使性能提高30%或更多。
如圖3所示,Virtex-5系列產(chǎn)品的靜態(tài)功耗與 Virtex-4 器件相當,但比競爭性 FPGA 具有明顯的優(yōu)勢。作為唯一的65納米 FPGA,Virtex-5 器件核心的動(dòng)態(tài)功耗比市場(chǎng)上其它高性能 FPGA 低至少35-40%。像新型 6-LUT 和對角線(xiàn)對稱(chēng)的互聯(lián)等架構上的革新,使實(shí)際核心動(dòng)態(tài)功耗進(jìn)一步降低了50%或以上。此外,利用數量空前的專(zhuān)用模塊進(jìn)一步降低了功耗。
欲獲取更多關(guān)于如何利用 Virtex-5 器件低功耗性能的資料,請訪(fǎng)問(wèn)www.xilinx.com/cn//power。
Xilinx 功耗估算器(XPE)
2006年1月上世的Xilinx 功耗估算器(XPE),是一種基于電子數據表的功耗工具,支持VirtexTM-4 和最新推出的 Virtex-5 和 SpartanTM-3 FPGA 系列產(chǎn)品。XPE 被設計用來(lái)替代網(wǎng)絡(luò )功耗工具,是所有新型 XilinxFPGA 系列產(chǎn)品在初步設計時(shí)使用的主要功耗估計工具。與以往的功耗估計工具相比,XPE 的主要優(yōu)勢在于改進(jìn)的用戶(hù)界面、更高的精度和對重要數據更好的顯示方法。
XPE 的概要頁(yè)顯示了能量使用的完整概述,首先是資源類(lèi)型,接著(zhù)是電源電壓。你能夠使用概要頁(yè)上的導航按鈕來(lái)查詢(xún)更詳細的信息。XPE 會(huì )自動(dòng)顯示一些圖表,幫助用戶(hù)創(chuàng )建能量使用圖。
繼發(fā)布初始版本之后,Xilinx 又陸續發(fā)布了一些更新版本的XPE,包括了許多附加特性和精度的提高。www.xilinx.com/cn/power上提供了這些版本和它們所支持的 Virtex-5 和Spartan-3E 器件的列表。
Kevin Bixler
Xilinx公司功耗工具產(chǎn)品市場(chǎng)工程師
評論