<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 芯片,太耗電了

芯片,太耗電了

發(fā)布人:旺材芯片 時(shí)間:2024-08-11 來(lái)源:工程師 發(fā)布文章

圖片

處理器和數據中心架構正在發(fā)生變化,以滿(mǎn)足運行 AI 和大型語(yǔ)言模型 (LLM) 的服務(wù)器的更高電壓需求。


曾經(jīng),服務(wù)器運行時(shí)耗電量只有幾百瓦。但在過(guò)去幾十年里,由于需要處理的數據量大幅增加,以及用戶(hù)要求更快處理數據,情況發(fā)生了巨大變化。NVIDIA 的Grace Blackwell芯片消耗 5 到 6 千瓦,這大約是過(guò)去服務(wù)器功耗的 10 倍。


功率是電壓乘以電流?!叭绻倚枰?5 千瓦,我可以在 120 伏的標準電壓下實(shí)現,” Rambus的杰出發(fā)明家 Steven Woo 說(shuō)道?!暗倚枰?40 安培的電流,這是很大的電流?!?/span>


這類(lèi)似于你在五金店購買(mǎi)的那種電線(xiàn)?!俺箅娏麟娋€(xiàn)有很多不同的直徑,而且非常粗,”Woo 說(shuō)?!耙郧按蠹叶颊J為服務(wù)器的功率可能是 1 或 2 千瓦,對于 120 伏電壓,你只需提供 10 安培的電流?,F在,由于功率需求高得多,如果我將電壓保持在 120 伏,我必須提供四倍甚至更高的電流,但電線(xiàn)無(wú)法承受這么大的電流。它們會(huì )熔化?!?/p>


如果不能提高電流,那么另一個(gè)選擇就是提高電壓?!半娏鞒艘噪妷罕仨毜扔?5 千瓦,”Woo 指出?!叭缃穹?wù)器的電壓為 48 伏,而以前是 12 伏?,F在 NVIDIA 正在討論 48 伏,他們將電壓提高了四倍,這使得他們能夠在保持電流不變的情況下將功率提高四倍?!?/p>


這種變化反映在電源上。西門(mén)子 EDA 嵌入式電路板系統部市場(chǎng)開(kāi)發(fā)經(jīng)理 Rod Dudzinski 指出:“我們看到客戶(hù)在構建大型數據中心時(shí),尋求不同的途徑來(lái)提供運行機架式系統所需的電力。一些數據中心公司正在借鑒高性能電源模塊和相關(guān)電力電子產(chǎn)品的理念和概念來(lái)實(shí)現這一目標,例如高效的電源轉換為熱效率再到終身可靠性。到 2025 年,傳統數據中心的功耗預計將增加 50%,因此,電路板級電源轉換效率和功率密度對于系統架構師來(lái)說(shuō)是首要考慮因素,應將其作為減少系統中每個(gè) PCB 配電網(wǎng)絡(luò ) (PDN) 損耗的手段?!?/span>


類(lèi)似的變化也反映在 EDA 中。Movellus 戰略營(yíng)銷(xiāo)副總裁 Lee Vick 表示,數據中心電源領(lǐng)域正在發(fā)生的事情與 EDA 領(lǐng)域正在發(fā)生的事情有相似之處?!霸谛酒O計領(lǐng)域,我們過(guò)去的情況是,通過(guò) EDA 工具流程單獨制作晶體管,但這些工具是一系列不同的工具——布局工具、時(shí)序工具、布線(xiàn)工具。最終,我們不得不轉向一個(gè)集成這些工具、集成流程和集成數據的世界,以滿(mǎn)足現代世界的性能需求?,F在,即使是 EDA 公司也不會(huì )止步于設計,因為你必須管理芯片的生命周期,從設計到測試和制造,一直到現場(chǎng),在那里他們會(huì )對設備進(jìn)行檢測并捕獲遙測數據,以反饋到設計過(guò)程中并改進(jìn)測試。這是一個(gè)完整的生命周期。這是一個(gè)完全集成的垂直流程(即使它在時(shí)間框架上是水平的),這是至關(guān)重要的?!?/p>


類(lèi)似的趨勢也適用于數據中心的電力?!耙郧?,當你設計芯片時(shí),你會(huì )有一個(gè)電力預算,”維克說(shuō)?!盎蛘?,如果你是一名工程師,你被賦予一個(gè)模塊來(lái)設計,你會(huì )有一個(gè)針對該特定模塊的電力預算,你不敢超出這個(gè)預算。但這就是你需要關(guān)心的一切——輸入和輸出?,F在情況已經(jīng)不同了。在數據中心,我們看到需求已經(jīng)遠遠超出了子集或芯片,擴展到主板、機架、數據中心層面。當你談?wù)搶θ蚍秶鷥扔幸饬x的能源需求時(shí),是時(shí)候將所有這些都付諸實(shí)施了?!?/p>


這里的連鎖反應很重要,而不僅僅是必須將功耗降至最低?!懊總€(gè)人都必須將功耗降至最低,”他說(shuō)?!坝邢拗?,有需求,有變化正在發(fā)生,你必須能夠對它們做出反應。另一個(gè)關(guān)鍵的事情是,我們已經(jīng)遠遠超越了假設,超越了‘這是未來(lái)的事情’的夸張。在最近的 DAC 上,我們有一個(gè)小組,討論的是管理千瓦功率預算。我們有來(lái)自 IC 設計、EDA、IP 和系統設計的行業(yè)專(zhuān)家。所有這些部分都發(fā)揮了作用。這不是 IP 提供商、芯片設計師或 EDA 公司可以單獨解決的問(wèn)題。這需要每個(gè)人共同努力。同樣,在數據中心,我們必須改善分配和冷卻,這只會(huì )在宏觀(guān)層面增加能耗。但現代數據中心的芯片和芯片內部的大量芯片和計算元件的規模只會(huì )加劇這種情況?!?/p>


Ansys首席應用工程師 Ashutosh Srivastava認為,這種情況是雙向的,因為芯片設計會(huì )導致功耗激增,因為最新的 AI 芯片(包括 GPU)在進(jìn)行更大、更快的計算時(shí)會(huì )消耗更多能量。在某些情況下,每臺服務(wù)器的功耗超過(guò) 2 千瓦?!芭c此同時(shí),芯片架構師也在尋求設計一種芯片來(lái)優(yōu)化功耗而不影響性能,因為它們的運行成本會(huì )更高——不僅是電力成本,還有冷卻基礎設施?!?/p>


此外,數據中心的上游配電也正在發(fā)生變化,以適應更大的電力需求,其中包括將機架中的分布式總線(xiàn)電壓從舊的 12V 更改為 48V。Srivastava 表示:“通過(guò)將電壓提高 4 倍,電流減少了 4 倍,傳導損耗減少了 16 倍。機架中的每個(gè)轉換器也經(jīng)過(guò)重新設計,以提高效率。通過(guò)轉換器的放置,可以?xún)?yōu)化與芯片直接供電相關(guān)的功率損耗。將芯片的電源直接堆疊在頂部有助于減少這種功率損耗?!?/p>




新數據中心考慮因素




數據中心設計的另一個(gè)重要考慮因素是其位置?!巴ǔ?,這些數據中心位于城市地區,因此數據中心的能源效率不高——與人口的電力需求競爭可能會(huì )限制其容量,”Srivastava 說(shuō)?!耙虼?,一些地區禁止建造新的數據中心,如果情況緊急,數據中心將需要減少其電力負荷,以便為社區的其他重要區域供電。這意味著(zhù)要么制造節能的計算硬件,要么尋找替代電源。這導致了另一種趨勢,大型數據中心現在正在考慮建造自己的發(fā)電廠(chǎng)來(lái)提供所需的電力,尤其是來(lái)自可持續和可靠來(lái)源的電力。這可能采用傳統的太陽(yáng)能或風(fēng)能與儲能相結合的形式,甚至正在開(kāi)發(fā)中的小型模塊化核反應堆 (SMR)?!?/p>


數據中心的電源管理是一項不斷發(fā)展的挑戰。Cadence 產(chǎn)品工程總監 Mark Fenton 表示: “IT 負載在一天中可能會(huì )發(fā)生很大波動(dòng),受到各種應用程序需求的影響?!?nbsp;“機柜的功率是一組復雜的變化變量——其當前用電量、未來(lái)項目的預算容量以及最大設計限制。反過(guò)來(lái),電力分配和容量可以在多個(gè)數據中心之間共享?!?/span>


例如,在共置環(huán)境中,用戶(hù)不斷調整對共享系統的需求,幾乎不了解 IT 已安裝或即將安裝的內容?!靶碌?GPU 工作負載表現出不同的功率行為,通常會(huì )導致大量且幾乎瞬時(shí)的功率峰值,”Fenton 說(shuō)?!斑@些波動(dòng)對數據中心電力基礎設施構成了重大的故障風(fēng)險,這是一個(gè)主要問(wèn)題。為了優(yōu)化效率并最大限度地利用可用功率,利用三相電源是有益的。但平衡相位以防止效率低下至關(guān)重要?!?/span>




電壓轉換中的功率損耗




數據中心的電壓轉換涉及多個(gè)轉換和調節階段,這可能導致嚴重的功率損耗?!叭绻业姆?wù)器現在有 48 伏電壓,那么問(wèn)題在于芯片本身仍然需要在 12 伏或 5 伏,甚至 1 伏電壓下運行,”Rambus 的 Woo 說(shuō)道?!斑@意味著(zhù)必須降低電壓。但每次降低電壓時(shí),都會(huì )損失一些功率,因此效率會(huì )開(kāi)始下降。這是因為轉換電壓水平需要功率,所以這是一個(gè)大問(wèn)題。轉換不同的電壓會(huì )消耗大量功率?!?/p>


這意味著(zhù)數據中心基礎設施必須將建筑公用設施電源轉換為機架級的單相或三相電源?!半妷嚎赡軙?huì )從 13.8 kV(中壓)降至 480 V 或 208 V(低壓),隨后降至 240 V 或 120 V,”Fenton 說(shuō)?!安糠重撦d下的效率往往更高,而且由于大多數電源采用 2N 冗余供電,因此系統的很大一部分在這些部分負載條件下運行?!?/p>


Ansys 高級應用工程師 Steve Chwirka 指出,損耗始于將公用電源從 480V 交流電降壓的大型變壓器?!斑@種新的較低交流電壓通過(guò)多種類(lèi)型的電纜和 PDU(配電單元)進(jìn)行分配,這些 PDU 基本上是非常大的母線(xiàn)。所有這些都會(huì )導致系統中的傳導損耗。有幾種電源轉換級別也與功率損耗有關(guān)。其中包括不間斷電源 (UPS),它在故障條件下為機架供電,時(shí)間剛好夠備用發(fā)電機啟動(dòng)。主要的轉換發(fā)生在機架上,交流電壓轉換為高壓直流,然后通過(guò)電源單元 (PSU) 轉換為較低的直流電壓。這個(gè)直流電壓現在要經(jīng)過(guò)幾個(gè)級別的轉換,才能到達實(shí)際的芯片?!?/span>


在每個(gè)級別,功率損耗量都不同。從公用設施輸入到芯片,Chwirka 對功率損耗進(jìn)行了一些估算?!半娏ψ儔浩魇欠浅8咝У臋C器,損耗僅為 1% 到 2%。UPS 系統的效率會(huì )根據其設計和負載條件而有所不同。提供最高級別保護的在線(xiàn) UPS 系統的效率通常為 90% 到 95% 之間。因此,它們會(huì )損耗 5% 到 10% 的電力。PDU 也有一些固有損耗。這些損耗會(huì )導致大約 1% 到 2% 的額外損耗?,F代 PSU 的效率通常為 80% 到 95% 之間。這意味著(zhù)在從交流轉換為直流的過(guò)程中可能會(huì )損耗 5% 到 20% 的功率。額外的轉換器(有時(shí)稱(chēng)為中間總線(xiàn)轉換器 (IBS))將機架的 48 V DC 轉換為 8 到 12 V DC,效率可高達 98% 左右。由于尺寸限制,芯片所需的低電壓的最終轉換效率比IBC略低?!?/span>




關(guān)于電力輸送你需要知道什么




在設計數據中心環(huán)境時(shí)需要考慮很多因素,其中最重要的事情之一就是高電壓周?chē)幕A設施?!叭绻唠妷哼M(jìn)入系統,你需要知道如何將電壓降低到你需要的水平,”Woo 指出?!翱赡苁且恍┩獠侩娐吩谶M(jìn)行降壓。有一些片上方法可以在小范圍的電壓上進(jìn)行電壓管理。最重要的是真正了解你的芯片將消耗多少電量,并了解這些電量來(lái)自哪里。這通常是一個(gè)系統級問(wèn)題。還有關(guān)于老化的問(wèn)題,因為有時(shí)芯片升溫時(shí)會(huì )發(fā)生膨脹。制造芯片的不同材料的膨脹速率都不同,如果進(jìn)行熱循環(huán)(即在高溫和低溫之間頻繁切換),這可能會(huì )導致開(kāi)裂和其他可靠性問(wèn)題?!?/p>


架構也有影響。Ansys 研究員 Norman Chang 解釋說(shuō),隨著(zhù) 3D-IC 芯片組越來(lái)越大,芯片架構師需要考慮將電源垂直分配到芯片組,例如 Tesla D1 Dojo 芯片中的電源系統設計?!凹軜嫀熯€需要考慮熱分布,因為通過(guò)系統技術(shù)協(xié)同優(yōu)化,3D-IC 中放置了數十個(gè)芯片,”他說(shuō)?!?D-IC 中的模擬/混合信號設計需要放置在對峰值計算工作負載產(chǎn)生的熱/應力變化不太敏感的位置。


最終,數據中心電力輸送方面的挑戰將落入芯片和系統架構師的視野。Movellus 的 Vick 表示:“作為一名計算機架構師,我非常注重數字化和處理器。后來(lái)我開(kāi)始為硬 IP 公司工作,他們會(huì )問(wèn)‘你們的供電有多少個(gè)脈沖?’我會(huì )說(shuō)‘我不知道。電源就在那里。它總是干凈的,你不必擔心?!珜?shí)施和集成等因素很重要——你的電源有多干凈,以及你如何布線(xiàn)。我們在架構層面看到的一件事是,當你集成電路的模擬部分時(shí),無(wú)論是電源調節、傳感器還是時(shí)鐘,你必須將模擬電壓運行到傳統數字區域這一簡(jiǎn)單事實(shí)可能會(huì )嚴重破壞你的設計。假設我有一大塊消耗大量能源的數字邏輯。我想看看電網(wǎng)上發(fā)生了什么。我想看看是否出現了信號下降。但你卻想讓我把一個(gè)模擬傳感器塞進(jìn)所有這些數字門(mén)海的中間。這很難做到?!?/p>


將模擬設計遷移到數字設計可以讓你更自由地進(jìn)行更多儀表操作并了解正在發(fā)生的事情?!斑@是超出模塊功能范圍的一個(gè)例子,”維克說(shuō)?!芭?,當然,這與實(shí)施有很大關(guān)系,所以我們正在從深奧的東西轉向現實(shí)世界,現實(shí)世界的實(shí)施很重要。這不是我是否可以設計這個(gè)東西,或者我是否可以獲得最佳的 TOPS/watt 數字。我可以在實(shí)際設計中實(shí)際實(shí)現它嗎?我能處理嘈雜的電源嗎?我能否處理不再設計得足夠堅固以承受我扔給它的任何東西的電網(wǎng),因為如果你設計那樣,你將失去競爭力。所需的裕度和過(guò)度設計量表明我再也無(wú)法承受那樣的設計,這意味著(zhù)現在我的電網(wǎng)本身受到與我的邏輯相同的設計約束。它正行駛在那條崎嶇的邊緣,有時(shí)它會(huì )出現偏移,會(huì )出現掙扎,我必須從硬件和軟件的角度來(lái)考慮這個(gè)問(wèn)題,而不是假設有無(wú)限的清潔能源?!?/p>

來(lái)源:半導體行業(yè)觀(guān)察

--End--


*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。



關(guān)鍵詞: 芯片

相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>