圖形處理單元(GPU)、中央處理單元(CPU)、定制人工智能專(zhuān)用集成電路(ASIC)以及其他人工智能加速器,涵蓋參與者分析、技術(shù)、趨勢、供應鏈和預測
前沿人工智能吸引了全球數千億美元的投資,各國政府和超大規模云服務(wù)提供商競相在藥物發(fā)現和自主基礎設施等領(lǐng)域取得領(lǐng)先地位。圖形處理單元(GPU)和其他人工智能芯片在推動(dòng)人工智能增長(cháng)方面發(fā)揮了重要作用,為數據中心和云計算基礎設施中的深度學(xué)習提供了所需的計算能力。GPU在提供計算能力方面發(fā)揮了關(guān)鍵作用,是大型語(yǔ)言模型(LLM)和生成式人工智能浪潮下的主導力量。然而,隨著(zhù)對更高效計算、更低成本、更高性能、大規??蓴U展系統、更快推理和特定領(lǐng)域計算的需求增加,其他人工智能芯片也有機會(huì )在流行度上增長(cháng)。
本文引用地址:http://dyxdggzs.com/article/202505/470102.htm隨著(zhù)人工智能芯片的格局從僅限于GPU擴展到更多新型架構實(shí)現大規模商業(yè)化,IDTechEx的報告《2025-2035數據中心和云計算中的人工智能芯片:技術(shù)、市場(chǎng)、預測》提供了對數據中心和云計算中人工智能芯片市場(chǎng)的獨立分析。這包括對當前和新興技術(shù)的基準測試、技術(shù)分解和關(guān)鍵趨勢的分析,涵蓋了當前和新興的硬件架構、先進(jìn)節點(diǎn)技術(shù)和先進(jìn)半導體封裝,以及供應鏈、投資和政策方面的信息。報告提供了2025年至2035年數據中心和云計算人工智能芯片市場(chǎng)的詳細收入預測,按人工智能芯片類(lèi)型劃分,包括GPU、超大規模云服務(wù)提供商和云服務(wù)提供商(CSP)使用的定制人工智能專(zhuān)用集成電路(ASIC)、具備人工智能能力的中央處理單元(CPU)以及其他由人工智能芯片初創(chuàng )公司和大型供應商開(kāi)發(fā)的人工智能ASIC。
圖形處理單元(GPU)
人工智能最大的系統是大規模擴展的高性能計算(HPC)和人工智能系統——這些系統大量使用GPU。這些通常是超大規模人工智能數據中心和超級計算機,它們都可以提供每秒千萬(wàn)億次浮點(diǎn)運算(exaFLOPS)的性能,無(wú)論是本地部署還是通過(guò)分布式網(wǎng)絡(luò )。近年來(lái),NVIDIA憑借其Hopper(H100/H200)芯片取得了顯著(zhù)成功,并最近發(fā)布了Blackwell(B200/B300)芯片。AMD也憑借其MI300系列處理器(MI300X/MI325X)創(chuàng )建了具有競爭力的芯片。由于美國對先進(jìn)芯片的制裁,中國參與者也在開(kāi)發(fā)解決方案。這些高性能GPU繼續采用最先進(jìn)的半導體技術(shù)。一個(gè)例子是增加芯片上內存容量,頂級芯片擁有超過(guò)250GB的高帶寬內存(HBM),使具有更多參數的更大人工智能模型能夠在這些GPU上運行。這些芯片還采用了最先進(jìn)的半導體封裝解決方案,如臺積電的CoWoS-L封裝、小芯片和多芯片GPU,以及最先進(jìn)的工藝節點(diǎn)(5納米及以下)。報告中詳細探討了所有這些趨勢和市場(chǎng)活動(dòng)。
超大規模云服務(wù)提供商和云服務(wù)提供商使用的定制人工智能芯片
GPU一直是訓練人工智能模型的基礎,但存在局限性,例如高總擁有成本(TCO)、供應商鎖定風(fēng)險、特定人工智能操作的低利用率,以及對于特定推理工作負載可能過(guò)于強大。超大規模云服務(wù)提供商采用的一種新興策略是使用基于脈動(dòng)陣列的定制人工智能ASIC。這些芯片為人工智能工作負載設計了專(zhuān)用核心,每個(gè)操作的成本更低,針對特定系統(例如,變換器、推薦系統等)進(jìn)行了優(yōu)化,提供了高效的推理,并為超大規模云服務(wù)提供商和云服務(wù)提供商提供了在不犧牲性能的情況下實(shí)現全??刂坪筒町惢臋C會(huì )。報告提供了潛在風(fēng)險評估、關(guān)鍵合作伙伴關(guān)系、參與者活動(dòng)、基準測試和技術(shù)概述。
其他人工智能芯片
其他人工智能芯片正在被商業(yè)化以顛覆GPU,具有類(lèi)似和新穎的計算架構。一些大型芯片供應商,如英特爾、華為和高通,設計了人工智能加速器(例如,Gaudi、Ascend 910、Cloud AI 100),使用類(lèi)似于GPU的異構計算單元陣列,但專(zhuān)門(mén)用于加速人工智能工作負載。這些芯片在性能、能效和特定應用領(lǐng)域的靈活性之間取得了平衡。通常,這些芯片包含矩陣引擎和張量核心,這些核心被設計為以高吞吐量執行密集的線(xiàn)性代數運算,如GEMM(通用矩陣乘法)和BMM(批量矩陣乘法)。
專(zhuān)注于人工智能芯片的初創(chuàng )公司通常采用不同的方法,部署前沿架構和制造技術(shù),如數據流控制處理器、晶圓級封裝、空間人工智能加速器、內存中處理(PIM)技術(shù)和粗粒度可重構陣列(CGRAs)。許多公司已成功推出這些系統(Cerebras、Groq、Graphcore、SambaNova、Untether AI等),用于數據中心和云計算,通常開(kāi)發(fā)機架級解決方案以便于企業(yè)部署,或在其自己的云平臺上提供使用。這些系統在擴展環(huán)境中表現卓越。IDTechEx的報告提供了全面的基準測試、比較、關(guān)鍵趨勢、技術(shù)分解和參與者活動(dòng)。
設計人工智能芯片和供應鏈
開(kāi)發(fā)具有競爭力吞吐量的人工智能芯片,用于訓練(訓練時(shí)間)和推理(每秒令牌數),高能效(TOPS/瓦特)以及相關(guān)的軟件支持,對所有芯片設計者來(lái)說(shuō)都是一個(gè)嚴格的挑戰。這個(gè)過(guò)程涉及到許多步驟的精細平衡,包括選擇編程和執行模型、設計優(yōu)化的硬件和內存架構,以及使用先進(jìn)工藝節點(diǎn)和先進(jìn)半導體封裝進(jìn)行制造。例如,數據中心芯片正在采用臺積電、英特爾代工和三星代工的最先進(jìn)工藝節點(diǎn),使用ASML的極紫外(EUV)光刻技術(shù)。這些代工廠(chǎng)正在推動(dòng)晶體管技術(shù)從5納米技術(shù)發(fā)展到使用FinFET(Fin場(chǎng)效應晶體管)的2納米節點(diǎn)以下,使用GAAFET(環(huán)繞柵極FET)和背面供電。報告中包含了最近的制造發(fā)展、設備要求、硬件架構分解、先進(jìn)半導體封裝細節、供應鏈以及編程模型比較。
設計和制造中涉及的各種技術(shù)為整個(gè)半導體行業(yè)供應鏈的未來(lái)技術(shù)創(chuàng )新提供了廣泛的空間。政府政策和大量投資顯示出推動(dòng)前沿人工智能達到新高度的普遍興趣,這將需要在人工智能數據中心中使用大量的人工智能芯片來(lái)滿(mǎn)足這一需求。IDTechEx預測,從2025年到2030年,這一市場(chǎng)將以14%的年復合增長(cháng)率增長(cháng),收入超過(guò)4000億美元。
評論