英特爾(INTC.US)推出新一代AI芯片Gaudi 3 采用臺積電5nm工藝
周二,英特爾(INTC.US)在其Intel Vision 2024產(chǎn)業(yè)創(chuàng )新大會(huì )上,面向客戶(hù)和合作伙伴作出了一系列重磅宣布。這些宣布包括推出全新的Gaudi 3人工智能加速器、全新的至強6品牌,以及包括開(kāi)放、可擴展系統和下一代產(chǎn)品在內的全棧解決方案,還有多項戰略合作。
本文引用地址:http://dyxdggzs.com/article/202404/457362.htm據數據預測,到2030年,全球半導體市場(chǎng)規模將達到1萬(wàn)億美元,人工智能將是主要的推動(dòng)力。然而,截至2023年,僅有10%的企業(yè)成功將其AI生成內容(AIGC)項目商業(yè)化。英特爾的最新解決方案旨在幫助企業(yè)克服推廣AI項目時(shí)遇到的挑戰,加快AIGC的商業(yè)應用。
英特爾現有的Gaudi 2在2022年5月推出,并于2023年7月正式進(jìn)入中國市場(chǎng)。它以高性能、高效率和高性?xún)r(jià)比而著(zhù)稱(chēng)。該產(chǎn)品采用臺積電7nm工藝,具備24個(gè)可編程的Tenor張量核心、48MB的SRAM緩存、21個(gè)10萬(wàn)兆內部互連以太網(wǎng)接口、96GB的HBM2E高帶寬內存等,能夠滿(mǎn)足大規模語(yǔ)言模型和生成式AI模型的計算需求。
新一代Gaudi 3專(zhuān)為AI訓練和推理設計,采用了臺積電(TSM.US)5nm工藝,帶來(lái)了兩倍的FP8 AI算力和四倍的BF16 AI算力,以及更高的網(wǎng)絡(luò )和內存帶寬。與NVIDIA H100相比,Gaudi 3在流行的大型語(yǔ)言模型(LLM)上具有更高的推理性能和更快的訓練速度。
預計Gaudi 3將顯著(zhù)縮短不同規模的Llama2模型和GPT-3模型的訓練時(shí)間,并在Llama和Falcon等大型語(yǔ)言模型上提供出色的推理吞吐量和能效。Gaudi 3支持多種形式因素,包括與OAM兼容的夾層卡、通用基板和PCIe擴展卡,滿(mǎn)足各種應用需求。
Gaudi 3還提供開(kāi)放的、基于社區的軟件支持,并通過(guò)標準以太網(wǎng)網(wǎng)絡(luò )實(shí)現從單節點(diǎn)到超級集群的靈活擴展,以支持大規模的推理、微調和訓練需求。
Gaudi 3的優(yōu)勢在于其高性能、經(jīng)濟實(shí)用、節能和快速部署能力,能夠有效滿(mǎn)足AI應用在復雜性、成本效益、數據可靠性和合規性等方面的需求。該加速器預計將在2024年第二季度開(kāi)始向OEM廠(chǎng)商出貨,包括戴爾、慧與、聯(lián)想和超威等品牌。
目前,英特爾Gaudi加速器已與NAVER、博世、IBM等眾多行業(yè)客戶(hù)和合作伙伴建立了合作關(guān)系。
此外,英特爾還宣布與Anyscale、DataStax等多家合作伙伴共同創(chuàng )建開(kāi)放平臺,推動(dòng)AI創(chuàng )新。該平臺旨在開(kāi)發(fā)開(kāi)放的、多供應商支持的AIGC系統,提供先進(jìn)的部署便利性、性能和價(jià)值。
英特爾計劃利用至強處理器和Gaudi加速器,推出AIGC流水線(xiàn)的參考實(shí)現,發(fā)布技術(shù)概念框架,并進(jìn)一步加強Intel Tiber開(kāi)發(fā)者云平臺基礎設施的功能,以助力企業(yè)在A(yíng)I創(chuàng )新領(lǐng)域取得突破。
截至周二收盤(pán),英特爾收漲0.92%,報38.33美元。
評論