<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 英特爾以強大產(chǎn)品力,迎接生成式AI的廣闊機遇

英特爾以強大產(chǎn)品力,迎接生成式AI的廣闊機遇

作者: 時(shí)間:2023-03-30 來(lái)源:電子產(chǎn)品世界 收藏


本文引用地址:http://dyxdggzs.com/article/202303/445081.htm

要點(diǎn)速覽:

●   新聞:近日,頂級機器學(xué)習開(kāi)源庫Hugging Face分享性能結果,展示了Habana? Gaudi?2 AI硬件加速器針對1760億參數大模型卓越的運行推理速度。同時(shí),該結果亦展現了在Gaudi2服務(wù)器上運行主流計算機視覺(jué)工作負載時(shí)的能效優(yōu)勢。

●   重要意義:目前,ChatGPT等工具正在為整個(gè)行業(yè)帶來(lái)全新的能力,而其模型所需的計算亦使性能、成本和能效成為眾多企業(yè)關(guān)注的焦點(diǎn)。

●   縱觀(guān)大局:隨著(zhù)模型變得越來(lái)越大,在數據預處理到訓練和推理等一系列復雜的AI負載功能上,能效成為推動(dòng)生產(chǎn)力的關(guān)鍵因素。開(kāi)發(fā)人員需要一種靈活、開(kāi)放、高能效和更可持續的解決方案,即“一次構建、隨處部署”的方法,使各種形式的AI(包括)都能充分發(fā)揮其潛力。

●   下一步:AI已經(jīng)走過(guò)很長(cháng)的一段路,但仍有更多方面有待挖掘。致力于A(yíng)I的真正民主化和可持續性,這將使人們能夠通過(guò)開(kāi)放的生態(tài)系統更廣泛地從該技術(shù),以及生成式AI技術(shù)中獲益。

●   總結:一個(gè)開(kāi)放的生態(tài)系統讓開(kāi)發(fā)人員能夠利用對流行開(kāi)源框架、庫和工具的優(yōu)化,來(lái)構建和部署AI。AI智能硬件加速器以及第四代英特爾?至強?可擴展處理器的內置加速器提升了性能和每瓦性能,以滿(mǎn)足生成式AI對性能、價(jià)格和可持續性的需求。

生成式AI能夠模仿人類(lèi)生成的內容,在改變我們工作和生活方式的諸多方面提供了一個(gè)令人興奮的機會(huì )。然而,這種快速演進(jìn)的技術(shù)也揭示出,在數據中心成功利用AI需要極其復雜的計算。

英特爾面向未來(lái)進(jìn)行了大量投資,希望每個(gè)人都能利用這項技術(shù),并能輕松進(jìn)行大規模部署。同時(shí),英特爾正與產(chǎn)業(yè)伙伴接洽,以支持一個(gè)基于信任、透明和多種選擇的開(kāi)放式AI生態(tài)系統。

擁抱具有卓越性能的開(kāi)源生成式AI

生成式AI例如GPT-3和DALL-E等語(yǔ)言模型已經(jīng)存在一段時(shí)間了,但ChatGPT(一種可以進(jìn)行類(lèi)似人類(lèi)對話(huà)的生成式AI聊天機器人)則引發(fā)巨大轟動(dòng),讓人們開(kāi)始關(guān)注傳統數據中心架構的瓶頸。ChatGPT還加快了對硬件和軟件解決方案的需求,這些解決方案使AI能夠充分發(fā)揮其潛力?;陂_(kāi)放方法和異構計算的生成式AI使其更容易獲得,并更經(jīng)濟地部署最優(yōu)的解決方案。開(kāi)放生態(tài)系統允許開(kāi)發(fā)人員在優(yōu)先考慮功耗、價(jià)格和性能的同時(shí),隨時(shí)隨地構建和部署AI,從而釋放生成式AI的力量。

網(wǎng)絡(luò )研討會(huì ):英特爾將舉辦數據中心和人工智能事業(yè)部投資者網(wǎng)絡(luò )研討會(huì )

英特爾正在積極采取措施,并通過(guò)優(yōu)化主流的開(kāi)源框架、庫和工具來(lái)實(shí)現出色的硬件性能,同時(shí)消除復雜性,來(lái)確保自身是實(shí)現生成式AI的明智選擇。近日,頂級機器學(xué)習開(kāi)源庫Hugging Face發(fā)布的結果顯示了英特爾AI硬件加速器卓越的推理運行速度,該結果基于對包含1760億個(gè)參數的BLOOMZ模型(一種基于轉換器的多語(yǔ)言大型語(yǔ)言模型(LLM)和包含70億參數的較小BLOOMZ模型進(jìn)行推理。其中,對于包含70億參數的較小BLOOMZ模型,Habana?第一代 Gaudi?具有明顯的性?xún)r(jià)比優(yōu)勢。此外,Hugging Face Optimum Habana庫簡(jiǎn)化了大型LLM的部署,用戶(hù)僅需對代碼進(jìn)行極小的修改。

英特爾研究院的研究人員還使用Habana Gaudi2在LMentry(一種最近提出的語(yǔ)言模型基準)零次學(xué)習設置下評估BLOOMZ。BLOOMZ的精度與GPT-3模型尺寸相似,如下圖所示,最大的176B BLOOMZ模型的性能優(yōu)于類(lèi)似大小的GPT-3模型。

image.png

在100K LMentry提示上,BLOOMZ模型(最多1760億個(gè)參數)使用Habana Gaudi加速器對生成的語(yǔ)言輸出進(jìn)行的自動(dòng)評估。1

此外,Hugging Face亦介紹了Stability AI的Stable Diffusion,這是另一個(gè)用于從文本生成圖像的最先進(jìn)生成式AI模型之一,也是流行的 DALL-E圖像生成器的開(kāi)放訪(fǎng)問(wèn)替代方案,Stable Diffusion在內置英特爾?高級矩陣擴展(英特爾?AMX)的第四代英特爾至強可擴展處理器上運行的平均速度提高了3.8倍。這種加速是在不更改任何代碼的情況下實(shí)現的。此外,通過(guò)使用英特爾Extension for PyTorch with Bfloat16(一種用于機器學(xué)習的自定義格式),自動(dòng)混合精度可以再提速一倍,并將延遲減少到5秒——比初始基線(xiàn)32秒快了近6.5倍。用戶(hù)可在Hugging Face網(wǎng)站上一個(gè)基于英特爾CPU(第四代至強處理器)的實(shí)驗性Stable Diffusion演示中進(jìn)行自行嘗試。

Stability AI創(chuàng )始人兼首席執行官Emad Mostaque表示:“在Stability AI,我們希望讓每個(gè)人都能構建自己的AI技術(shù)。英特爾已經(jīng)使Stable Diffusion模型能夠高效運行在他們的異構產(chǎn)品上——從第四代Sapphire Rapids CPU一直到像Gaudi這樣的加速器,因此是實(shí)現AI民主化的一個(gè)絕佳合作伙伴。我們期待在下一代語(yǔ)言、視頻和代碼模型等方面與他們合作?!?/p>

OpenVINO進(jìn)一步加速了Stable Diffusion推理。結合使用第四代至強CPU,它的速度幾乎比第三代英特爾?至強?可擴展CPU提高了2.7倍。Optimum Intel是OpenVINO支持的一個(gè)工具,用于加速英特爾架構上的端到端管道,它將平均延遲再降低3.5倍,總共降低近10倍。

解決價(jià)格、性能和效率問(wèn)題

此外,為滿(mǎn)足減少用電量的關(guān)鍵需求及不斷增長(cháng)的性能需求,還需要提供更加可持續的解決方案。一個(gè)開(kāi)放的生態(tài)系統可以消除阻礙進(jìn)步的障礙,使開(kāi)發(fā)人員能夠在每一項工作中都能夠使用最好的硬件和軟件工具進(jìn)行創(chuàng )新。

Gaudi2與第一代Gaudi構建在相同的高效架構上,可助力大規模工作負載的性能和效率達到全新高度,并在運行AI工作負載時(shí)展現出強大的能效優(yōu)勢。

大規模AI工作負載還需要達到“一次構建、隨處部署”方式,這種方式基于靈活、開(kāi)放的解決方案,能夠實(shí)現更好的能效。第四代至強處理器是英特爾最具可持續性的數據中心處理器,有著(zhù)更高的能效和節能效果。憑借英特爾AMX這樣的內置加速器,在廣泛的AI工作負載和使用案例中,推理和訓練性能可提高10倍2 ,同時(shí)其每瓦性能相較英特爾前代產(chǎn)品最多可提升14倍3。

1 2023年3月24日進(jìn)行測量,使用部署于英特爾開(kāi)發(fā)者云上的Habana Gaudi2深度學(xué)習服務(wù)器,該服務(wù)器采用8個(gè)Gaudi2 HL-225H夾層卡和第三代英特爾至強處理器,運行SynapseAI?軟件版本1.8.0,batch_size=1

2 參見(jiàn)intel.com/performanceindex:第四代英特爾至強可擴展處理器部分的[A16]及[A17]

3 參見(jiàn)intel.com/processorclaims:第四代英特爾至強可擴展處理器,E1結果可能不同。



關(guān)鍵詞: 英特爾 生成式AI

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>