以AI芯片架構創(chuàng )新,迎接算力增長(cháng)新拐點(diǎn)
在灣芯展SEMiBAY2024《HBM與存儲器技術(shù)與應用論壇》上,億鑄科技創(chuàng )始人、董事長(cháng)兼CEO熊大鵬發(fā)表了題為《超越極限:大算力芯片面臨的技術(shù)挑戰和解決策略》的演講。
本文引用地址:http://dyxdggzs.com/article/202410/463959.htm熊大鵬博士提出,在A(yíng)I大模型技術(shù)的推動(dòng)下,算力迎來(lái)需求拐點(diǎn),硬件架構將成為滿(mǎn)足算力需求的關(guān)鍵路徑之一,未來(lái)算力增長(cháng)將以存儲單元為中心。
大模型時(shí)代的機遇與挑戰
在A(yíng)I大模型時(shí)代,隨著(zhù)數據、算力、參數量的不斷提升,模型能力顯著(zhù)增強。熊大鵬博士指出,大模型已經(jīng)從量變逐漸演變?yōu)橘|(zhì)變,當模型體量足夠大時(shí),會(huì )出現類(lèi)似人類(lèi)“開(kāi)悟”的涌現能力,大模型的推理能力將顯著(zhù)提升。這一變化預示著(zhù)AI應用的最后一公里即將打通,業(yè)務(wù)落地將推動(dòng)對AI計算能力的需求迎來(lái)拐點(diǎn)。
Omdia最新報告《云計算和數據中心人工智能處理器預測》顯示,用于云計算和數據中心人工智能的GPU和其他加速芯片的市場(chǎng)規模已從2022年的不到100億美元增長(cháng)到2024年的780億美元,并預計到2029年將達到1510億美元。然而,2026年市場(chǎng)可能會(huì )出現一個(gè)明顯的拐點(diǎn),增長(cháng)動(dòng)力將從技術(shù)采用轉向人工智能應用需求的變化。
此外,IDC預測,未來(lái)的人工智能服務(wù)器將注重提高計算能力和處理效率(能效比),以適應更復雜、更大規模的人工智能應用。預計到2027年,用于推理的AI算力占比將達到72.6%,未來(lái)有望達到95%為推理,5%為訓練。
應用落地需要硬件架構突破
然而,現有的芯片硬件性能提升速度已難以滿(mǎn)足算法模型急劇增長(cháng)的算力需求。摩爾定律,這個(gè)曾經(jīng)指導半導體行業(yè)發(fā)展的黃金法則,如今正面臨前所未有的挑戰。國信證券經(jīng)濟研究所報告指出,大模型參數規模每18個(gè)月增長(cháng)35倍,而摩爾定律下的芯片僅增長(cháng)2倍。因此,探索和發(fā)展新的硬件架構成為算力突破的關(guān)鍵路徑之一。
熊大鵬博士強調,在現有的硬件架構下,目前AI芯片面臨著(zhù)“三堵墻”問(wèn)題:存儲墻、能耗墻和編譯墻。存儲墻是指存儲器的數據訪(fǎng)問(wèn)速度跟不上計算單元的數據處理速度,導致性能瓶頸的問(wèn)題。
同時(shí),由于存儲墻的存在則帶來(lái)了能耗墻和編譯墻的問(wèn)題。能耗墻是指隨著(zhù)芯片性能的提升,能耗和散熱問(wèn)題成為限制進(jìn)一步性能提升的主要因素。編譯墻則是隨著(zhù)AI模型的復雜性增加,編譯器需要處理的數據量和計算任務(wù)也急劇增加,這使得靜態(tài)編譯優(yōu)化變得非常困難,手動(dòng)優(yōu)化又消耗了大量時(shí)間和成本。
存算一體開(kāi)啟算力第二增長(cháng)曲線(xiàn)
面對這一挑戰,億鑄科技選擇創(chuàng )新,用“存算一體超異構”架構這一全新的芯片設計思路,極大地減少了數據搬運的延遲,提升了整體的計算效率和能效比。
熊大鵬博士指出,想要打破AI芯片“三堵墻”,就需要從算力的第一性原理(阿姆達爾定律)來(lái)著(zhù)手,將數據搬運量大幅下降,使得F值接近于0,才能保證有效算力密度線(xiàn)性增長(cháng)。目前業(yè)內主要存在兩種解決方式:一種是存內計算,另一種是近存計算。
存內計算是通過(guò)將存儲和計算功能融合,減少數據搬運延遲,提升性能和能效。在理想狀態(tài)下,F=0,能夠實(shí)現存儲與計算無(wú)縫融合。近存計算則是將存儲單元和計算單元通過(guò)先進(jìn)封裝集成在一起,增加訪(fǎng)存帶寬、減少數據搬移時(shí)延,以提升整體計算效率。
熊大鵬博士強調,通過(guò)存算一體架構等技術(shù),可以突破傳統計算模式的瓶頸,實(shí)現更高的有效算力,打破有效算力的天花板。未來(lái),以算力單元為中心的時(shí)代即將結束,算力第二增長(cháng)曲線(xiàn)將以存儲單元為中心。
結語(yǔ)
熊大鵬博士表示,億鑄科技自成立以來(lái),始終致力于通過(guò)存算一體,提供貢獻更具性?xún)r(jià)比、更高能效比、更大算力發(fā)展空間的AI大算力芯片發(fā)展新路徑。2023年3月,面對ChatGPT等大模型帶來(lái)的AI算力挑戰,億鑄科技首次提出“存算一體超異構”,為大模型時(shí)代AI大算力芯片發(fā)展提供全新思路。
未來(lái),隨著(zhù)AI技術(shù)的不斷進(jìn)步,算力的需求也在不斷增長(cháng)。億鑄科技將通過(guò)創(chuàng )新的存算一體架構,為AI芯片的發(fā)展提供新的方向。在大模型時(shí)代,億鑄科技的技術(shù)和產(chǎn)品將為AI技術(shù)的發(fā)展提供強大的支持,推動(dòng)整個(gè)行業(yè)向前發(fā)展。隨著(zhù)億鑄科技技術(shù)的不斷成熟和應用的不斷擴展,我們有理由期待,AI芯片技術(shù)將迎來(lái)一個(gè)新的發(fā)展階段,為科技進(jìn)步做出更大的貢獻!
評論