微軟推出首款自研大模型AI芯片!臺積電5nm、1050億顆晶體管,OpenAI率先試用
編輯 | 漠影
芯東西11月16日報道,今日凌晨,微軟在年度IT專(zhuān)業(yè)人士和開(kāi)發(fā)者大會(huì )Ignite上推出兩款自研芯片——云端AI芯片微軟Azure Maia 100、服務(wù)器CPU微軟Azure Cobalt 100。
▲微軟現場(chǎng)展示AI端到端機架
兩款芯片明年年初開(kāi)始在微軟數據中心推出,最初為微軟的Copilot或Azure OpenAI Service等服務(wù)提供動(dòng)力。微軟已經(jīng)在設計第二代版本的Azure Maia AI芯片和Cobalt CPU系列。▲納德拉與黃仁勛握手
當微軟CEO納德拉提問(wèn)未來(lái)AI創(chuàng )新的發(fā)展方向是什么,黃仁勛回答說(shuō):“生成式AI是計算史上最重要的平臺轉型。在過(guò)去40年里,從來(lái)沒(méi)有發(fā)生過(guò)如此大的事情。到目前為止,它比個(gè)人電腦更大、比手機更大,而且將比互聯(lián)網(wǎng)更大?!?/span>01.揭秘微軟造芯實(shí)驗室:實(shí)現最大硬件利用率
▲在微軟雷德蒙德實(shí)驗室里,一位系統級測試人員正在模擬芯片在微軟數據中心內的運行情況。這臺機器在真實(shí)世界的條件下嚴格評估每個(gè)芯片,以確保它符合性能和可靠性標準。(圖源:微軟)
微軟認為增加自研芯片是一種確保每個(gè)元素都適合微軟云和AI工作負載的方式。這些芯片將安裝在定制的服務(wù)器主板上、放在定制的機架上,隨著(zhù)機架被安裝到現有的微軟數據中心中。AI芯片微軟Azure Maia 100旨在實(shí)現硬件的絕對最大利用率,將為運行在微軟Azure上的一些最大的內部AI工作負載提供動(dòng)力。▲首批由微軟Azure Cobalt 100 CPU驅動(dòng)的服務(wù)器,位于華盛頓州昆西的一個(gè)數據中心內。(圖源:微軟)
“我們正在最有效地利用硅上的晶體管。將我們所有數據中心的服務(wù)器的效率提升相乘,這是一個(gè)相當大的數字?!盡cCulloug談道。02.從2020年開(kāi)始為云造芯,給AI芯片定制機架和“散熱助手”
▲在微軟雷德蒙德實(shí)驗室里,芯片正在進(jìn)行系統級測試,在安裝到服務(wù)器上之前,模擬它們在實(shí)際生產(chǎn)條件下的使用情況。(圖源:微軟)
今天公布的芯片架構不僅可以提高冷卻效率,還能優(yōu)化其當前數據中心資產(chǎn)的使用,并在現有范圍內最大限度地提高服務(wù)器容量。例如,不存在機架來(lái)容納Maia 100服務(wù)器主板的獨特需求,所以微軟從零做出更寬的數據中心機架。這種擴展的設計為電源和網(wǎng)絡(luò )電纜提供了充足的空間,能滿(mǎn)足AI工作負載的獨特需求。▲在微軟雷德蒙德實(shí)驗室的一個(gè)熱室里,為Maia 100 AI芯片和它的“伙伴”定制的機架。在處理AI工作負載的計算需求時(shí),新“助手”在機架之間循環(huán)液體來(lái)冷卻芯片。(圖源:微軟)
大型AI任務(wù)需要大量的計算、消耗更多的電力。傳統空氣冷卻方法無(wú)法滿(mǎn)足這些需求,液冷已成為應對這些熱挑戰的首選方案。但微軟目前的數據中心并不是為大型液冷機器設計的。因此它開(kāi)發(fā)了一個(gè)“助手”,放在Maia 100機架旁邊。這些“助手”的工作原理有點(diǎn)像汽車(chē)的散熱器。冷液從側板流向附著(zhù)在Maia 100芯片表面的冷板。每個(gè)板都有通道,液體通過(guò)這些通道循環(huán)以吸收和輸送熱量。這些熱量會(huì )流到副翼,副翼會(huì )從液體中去除熱量,并將其送回機架以吸收更多的熱量,以此類(lèi)推。▲冷板附著(zhù)在Maia 100 AI芯片的表面。(圖源:微軟)
McCullough強調說(shuō),機架和“助手”的串聯(lián)設計強調了基礎設施系統方法的價(jià)值。通過(guò)控制每一個(gè)方面——從Cobalt 100芯片的低功耗理念到數據中心冷卻的復雜性——微軟可以協(xié)調每個(gè)組件之間的和諧相互作用,確保在減少環(huán)境影響方面,整體確實(shí)大于各部分的總和。微軟已經(jīng)與行業(yè)合作伙伴分享了其定制機架的設計經(jīng)驗,無(wú)論內部安裝的是什么芯片,微軟都可以使用這些經(jīng)驗。“我們建造的所有東西,無(wú)論是基礎設施、軟件還是固件,我們都可以利用我們自己的芯片,或是我們行業(yè)合作伙伴的芯片?!盡cCullough分享道,“這是客戶(hù)做出的選擇,我們正努力為他們提供最好的選擇,無(wú)論是性能、成本還是他們關(guān)心的任何其他方面?!?/span>Stemen說(shuō),微軟的使命很明確:優(yōu)化其技術(shù)堆棧的每一層,從核心芯片到終端服務(wù)。“微軟的創(chuàng )新將進(jìn)一步深入到芯片工作中,以確保我們客戶(hù)在A(yíng)zure上的工作負載的未來(lái),優(yōu)先考慮性能、能效和成本?!彼劦?,“我們有意選擇這項創(chuàng )新,以便我們的客戶(hù)能夠在今天和未來(lái)獲得Azure的最佳體驗?!?/span>大會(huì )期間,微軟還宣布了其中一個(gè)關(guān)鍵要素的全面可用性——Azure Boost,這是一個(gè)將存儲和網(wǎng)絡(luò )進(jìn)程從主機服務(wù)器轉移到專(zhuān)用硬件和軟件上的系統,有助于加快存儲和網(wǎng)絡(luò )的速度。03.英偉達推出AI代工服務(wù),助攻快速定制生成式AI模型
04.結語(yǔ):尚未公布具體芯片參數,如何影響云服務(wù)定價(jià)有待觀(guān)察
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。