生成式人工智能:半導體行業(yè)的下一個(gè)S曲線(xiàn)?
隨著(zhù)ChatGPT和Sora等生成式人工智能(gen AI)應用席卷全球,對計算能力的需求正在飆升。半導體行業(yè)發(fā)現自己正接近一個(gè)新的S曲線(xiàn)——對于高管來(lái)說(shuō),一個(gè)迫切的問(wèn)題是該行業(yè)是否能跟得上。
領(lǐng)導者們正在通過(guò)承諾大量的資本支出來(lái)擴大數據中心和半導體制造工廠(chǎng)(晶圓廠(chǎng)),同時(shí)探索芯片設計、材料和架構的創(chuàng )新,以滿(mǎn)足不斷發(fā)展的gen AI驅動(dòng)的商業(yè)格局的需求。
為了指導半導體行業(yè)領(lǐng)導者度過(guò)這一轉型階段,我們制定了幾種gen AI對B2B和B2C市場(chǎng)影響的情景。每個(gè)情景都涉及對計算和因此晶圓的巨大需求增長(cháng)。這些情景聚焦于數據中心,同時(shí)承認智能手機等邊緣設備的影響,但規模要小得多。
需求情景,來(lái)自麥肯錫的AI分析,是根據半導體行業(yè)可能提供的晶圓產(chǎn)量進(jìn)行的,考慮到資本和設備等約束因素。即使更加雄心勃勃的情景也是有可能的,但是對數據中心所需的晶圓數量以及數據中心所需的能源供應的影響將使它們不太可能出現。
本文將討論高性能組件的預計晶圓需求,包括邏輯、內存、數據存儲芯片,以及為它們提供支持所需的晶圓廠(chǎng)的數量。擁有這些信息,行業(yè)利益相關(guān)者可以戰略性地規劃和分配資源,以滿(mǎn)足不斷增長(cháng)的計算能力需求,確保未來(lái)幾年其運營(yíng)的可伸縮性和可持續性。
生成式人工智能計算需求的組成部分對于人工智能和生成式人工智能應用需求的激增伴隨著(zhù)與之成比例的計算需求增長(cháng)至關(guān)重要。然而,對于半導體行業(yè)領(lǐng)導者來(lái)說(shuō),理解這種需求的起源以及生成式人工智能將如何應用是至關(guān)重要的。我們預計將會(huì )看到兩種不同類(lèi)型的生成式人工智能應用:B2C和B2B用例。在B2C和B2B市場(chǎng)上,對于生成式人工智能的需求可以分為兩個(gè)主要階段:訓練和推斷。訓練通常需要大量的數據和計算資源。相比之下,推斷通常對于每個(gè)用例的運行需要更低的計算資源。
為了使半導體行業(yè)領(lǐng)導者能夠更好地應對這些市場(chǎng)的復雜性和需求,我們概述了B2B計算需求的六種用例原型及其相應的計算成本和同時(shí)生成的gen AI價(jià)值創(chuàng )造。
麥肯錫的分析估計,B2C應用將占大約70%的生成式人工智能計算需求,因為它們包括基本消費者互動(dòng)(例如起草電子郵件)和高級用戶(hù)互動(dòng)(例如從文本創(chuàng )建可視化內容)的工作量。預計B2B用例將占大約30%的需求。這些包括業(yè)務(wù)的高級內容創(chuàng )建(例如,生成市場(chǎng)材料)、解決客戶(hù)查詢(xún)或生成標準財務(wù)報告等用例。
跨行業(yè)垂直領(lǐng)域和功能的B2B應用可分為六種用例原型:
編碼和軟件開(kāi)發(fā)應用程序,解釋和生成代碼 創(chuàng )意內容生成應用程序,編寫(xiě)文檔和通信(例如生成營(yíng)銷(xiāo)材料) 客戶(hù)互動(dòng)應用程序,涵蓋自動(dòng)化客戶(hù)服務(wù)的外展、查詢(xún)和數據收集(例如通過(guò)聊天機器人處理客戶(hù)查詢(xún)) 創(chuàng )新應用程序,為研發(fā)過(guò)程生成產(chǎn)品和材料(例如設計候選藥物分子) 簡(jiǎn)化的摘要應用程序,使用結構化數據集總結和提取見(jiàn)解(例如生成標準財務(wù)報告) 復雜的摘要應用程序,使用非結構化或大型數據集總結和提取見(jiàn)解(例如在臨床圖像中合成MRI或CT掃描結果)
麥肯錫根據其價(jià)值創(chuàng )造和服務(wù)成本來(lái)定義這六個(gè)不同和復雜的B2B用例原型。通過(guò)定義服務(wù)成本和價(jià)值創(chuàng )造,決策者可以更熟練地了解B2B用例的具體情況,并在采用它們時(shí)做出明智的選擇。在核心,服務(wù)成本的分析包括訓練、微調和推斷成本。該分析還包括超大規模的基礎設施即服務(wù)(IaaS)邊際成本,其中包括計算硬件、服務(wù)器組件、IT基礎設施、能源消耗和估計的人才成本。通過(guò)諸如生產(chǎn)率改進(jìn)和勞動(dòng)力成本節約等指標,對生成式人工智能價(jià)值創(chuàng )造的評估。
生成式人工智能需求情景隨著(zhù)組織應對采用生成式人工智能的復雜性,這些原型的戰略利用變得至關(guān)重要。gen AI采用的經(jīng)濟模型、算法效率以及組件和系統級別的持續硬件進(jìn)步等因素進(jìn)一步影響了gen AI的采用和技術(shù)進(jìn)步。三種需求情景——基礎、保守和加速——代表了對B2B和B2C應用的生成式人工智能需求可能的結果?;A情景是根據一系列必要假設進(jìn)行的,例如持續的技術(shù)進(jìn)步和快速采用,由能夠覆蓋gen AI訓練和推斷的資本和運營(yíng)成本的商業(yè)模式支持。保守和加速采用情景代表了采用的上升和下降余地,分別。
麥肯錫的分析估計,到2030年,在基礎情景下,生成式人工智能的總計算需求可能達到25x1030 FLOPs(浮點(diǎn)運算),其中大約70%來(lái)自B2C應用,30%來(lái)自B2B應用。
B2C計算需求情景B2C計算需求受到與gen AI互動(dòng)的消費者數量、他們的互動(dòng)水平以及其計算含義的影響。具體來(lái)說(shuō),B2C推斷工作負載取決于每個(gè)用戶(hù)的gen AI互動(dòng)次數、gen AI用戶(hù)的數量以及每個(gè)基本和高級用戶(hù)互動(dòng)的FLOP。訓練工作負載取決于每年的訓練次數、gen AI模型提供者的數量以及不同gen AI模型的每次訓練運行的FLOP(例如2023年的最新模型,例如GPT-4,以及較小或較早的模型)。對于所有情景,公司能夠開(kāi)發(fā)可持續的商業(yè)模型至關(guān)重要。
對于所有情景,公司能夠開(kāi)發(fā)可持續的商業(yè)模型至關(guān)重要。
基礎采用。到2030年,預期的每日智能手機用戶(hù)的平均每天互動(dòng)次數(每次互動(dòng)是一系列提示)為基本消費者應用,例如起草電子郵件。另一個(gè)預期的平均數是高級消費者應用,例如創(chuàng )建更長(cháng)的文本或綜合復雜的輸入文檔。通過(guò)使用當前的在線(xiàn)和基于應用程序的搜索查詢(xún)的數字,麥肯錫的分析估計互動(dòng)次數約為預計的每日在線(xiàn)搜索查詢(xún)次數的兩倍(約280億)2030年。支持基本B2C情景的基本假設是穩定的技術(shù)進(jìn)步、有利的監管發(fā)展以及不斷增長(cháng)的用戶(hù)接受程度。
保守采用。此情景可能涉及消費者對數據隱私、監管發(fā)展的持續關(guān)注以及技術(shù)僅有漸進(jìn)性改進(jìn),導致基本情況的互動(dòng)次數減少一半。
加速采用。此情景表明對技術(shù)的高度信任和廣泛的用戶(hù)接受度。此情景的驅動(dòng)因素可能是具有吸引力的新商業(yè)模式、快速的技術(shù)進(jìn)步或有利的監管。例如,顛覆性的硬件架構將大大降低服務(wù)成本。此外,對軟件驗證過(guò)程的改進(jìn)可能會(huì )顯著(zhù)提高生成式人工智能解決方案的效率。諸如此類(lèi)的因素可能會(huì )加速采用曲線(xiàn),并導致2030年之前半導體行業(yè)中生成式人工智能實(shí)施的顯著(zhù)增長(cháng)。
生成式人工智能B2B需求情景生成式人工智能用例在B2B部門(mén)的采用受到半導體芯片供應的充分性和成本的顯著(zhù)影響。企業(yè)必須能夠合理化其對計算基礎設施的投資,確保服務(wù)成本低于公司的支付意愿。對于這些B2B需求情景,麥肯錫的分析假設支付意愿對應于總價(jià)值創(chuàng )造的約20%。
在B2B用例的背景下,麥肯錫的分析表明,六種用例原型中只有五種對廣泛采用是經(jīng)濟可行的。第六個(gè)原型,復雜摘要,預計由于與其成本相比的有限價(jià)值創(chuàng )造以及在分析復雜和非結構化數據輸入方面消耗大量計算資源,不會(huì )被廣泛采用。
評論