<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > Inflection AI宣布放棄英偉達GPU，轉投英特爾Gaudi 3懷抱！

Inflection AI宣布放棄英偉達GPU，轉投英特爾Gaudi 3懷抱！

發(fā)布人：芯智訊時(shí)間：2024-12-12 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

10月8日消息，近日人工智能（AI）技術(shù)公司Inflection AI宣布其最新的企業(yè)平臺將放棄采用英偉達（Nvidia）的GPU，轉而使用英特爾的Gaudi 3 加速器。

英特爾對此表示：“雖然 Inflection AI 的 Pi 客戶(hù)應用程序以前在英偉達GPU上運行，但 Inflection 3.0 將由英特爾Gaudi 3 提供支持，部署在英特爾 Tiber AI Cloud 提供的云中實(shí)例上?！?/p>

資料顯示，Inflection AI 成立于 2022 年，最初是一家AI大模型開(kāi)發(fā)廠(chǎng)商，開(kāi)發(fā)了一款名為 Pi 的對話(huà)式個(gè)人助理。然而，在今年春天，其主要創(chuàng )始人 Mustafa Suleyman 和 Karén Simoniyan 離開(kāi) Microsoft 后，這家初創(chuàng )公司已將重點(diǎn)轉移到使用其數據為企業(yè)構建定制的微調模型。

這家初創(chuàng )公司平臺的最新版本 Inflection 3.0 旨在使用他們自己的專(zhuān)有數據集對其模型進(jìn)行微調，目標是構建整個(gè)企業(yè)特定的 AI 應用程序。英特爾公司本身也將成為首批采用 Inflection 3.0服務(wù)的客戶(hù)之一，而這或許也是推動(dòng)讓Inflection放棄英偉達GPU，轉向采用英特爾Gaudi 3 加速器的原因。

雖然 Inflection 3.0將在英特爾Gaudi 3 加速器上運行，但Inflection AI公司不會(huì )馬上建立自己獨立的系統。與托管在亞馬遜Azure 中的 Inflection 2.5 類(lèi)似，最新版本將在英特爾的 Tiber AI Cloud 服務(wù)上運行。Inflection AI公司計劃從 2025 年第一季度開(kāi)始，提供基于英特爾 AI 加速器的物理系統。

雖然 Inflection AI正在使用 Gaudi 3 加速器來(lái)支持其企業(yè)平臺，但并不意味著(zhù)客戶(hù)只能使用 Gaudi 3 加速器來(lái)運行他們完成的模型。

AI 模型和軟件開(kāi)發(fā)并不便宜，但與所需的硬件加速器相比，還是要低很多。比如一個(gè)英偉達H100 GPU大約就需要30000美元，而英特爾的Gaudi 3 則要便宜很多，只要15000美元左右。

資料顯示，Gaudi 3基于臺積電5nm工藝，擁有 8 個(gè)矩陣數學(xué)引擎、64 個(gè)張量?jì)群恕?6MB SRAM（每個(gè)Tile 48MB，可提供12.8 TB/s的總帶寬）和 128 GB HBM2e 內存，16 個(gè) PCIe 5.0 通道和 24 個(gè) 200GbE 鏈路。在計算核心的周?chē)?，則是八個(gè)HBM2e內存堆棧，總容量為128 GB，帶寬為3.7 TBps。擁有 1,835 teraFLOPS 的密集 FP8 或 BF16 性能。

英特爾官方公布的數據顯示，Gaudi 3 在流行的大語(yǔ)言模型（LLM）訓練速度方面，比英偉達H100平均快了40%；在流行大模型的推理能效表現上，比如英偉達H100領(lǐng)先50%。英特爾 Gaudi 3 與英偉達 H100 在相同節點(diǎn)數量下，相關(guān)大模型訓練時(shí)間對比上最高快了1.7倍，其中，LLAMA2 70 億參數對比有 1.5 倍于 H100 的優(yōu)勢，LLAMA2 130 億參數最高有 1.7 倍的優(yōu)勢，GPT-3 1750 億參數有 1.4 倍優(yōu)勢。在大模型推理速度表現上，Gaudi 3 相比 H100 平均快了1.5倍，最高快了4倍。

雖然Gaudi 3的 FP8性能與 H100 大致相當，但在 BF16精度下，它提供的密集浮點(diǎn)性能幾乎是H100的兩倍，這對 Inflection 所針對的訓練和微調工作負載產(chǎn)生了很大的影響。至少在紙面上，Gaudi 3 不僅有望在訓練和推理方面比英偉達H100 更快，而且成本更低。

“通過(guò)在英特爾Gaudi 3上運行 Inflection 3.0，我們看到性?xún)r(jià)比提高了 2 倍...與目前的競爭產(chǎn)品相比?！癐nflection AI 首席執行官肖恩·懷特（Sean White）本周一在一篇博客文章中寫(xiě)道。

值得一提的是，IBM 也計劃將對 Gaudi 3 的支持擴展到其 watsonx AI 平臺。英特爾此前也曾宣布，該Gaudi 3 加速器已經(jīng)向戴爾科技和超威電腦（Supermicro）等OEM 發(fā)貨。

從明年開(kāi)始，Gaudi 將讓位于名為 Falcon Shores 的 GPU，它將英特爾的 Xe 圖形計算技術(shù)與 Habana 的技術(shù)融合在一起，從而導致有關(guān)遷移路徑的問(wèn)題是可以理解的。

英特爾堅持認為，對于在 PyTorch 等高級框架中編碼的客戶(hù)，后續向 Falcon Shores的遷移將大部分是無(wú)縫的。對于那些在較低級別構建 AI 應用程序的人，英特爾已承諾在 Falcon Shores 首次亮相之前提供額外的指南。

編輯：芯智訊-浪客劍

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：芯片

相關(guān)推薦

保證航天飛機起飛 NASA到處尋找8086芯片

hpnet | 2002-05-17

強力回擊！中方回應美國企圖全球禁用中國先進(jìn)芯片

芯片 AI 華為 Ascend 昇騰 | 2025-05-22

s3c4510 芯片手冊

資源下載 s3c4510 芯片手冊 | 2007-02-28

預測：全球通信芯片市場(chǎng)2003年將反彈

hpnet | 2002-05-25

西門(mén)子EDA暫停中國服務(wù)

EDA/PCB 西門(mén)子 EDA 芯片 | 2025-05-28

KS8999 以太網(wǎng)絡(luò )交換機芯片

資源下載 KS8999 以太網(wǎng)絡(luò )交換機芯片 | 2007-02-28

基于D類(lèi)功放專(zhuān)用驅動(dòng)芯片驅動(dòng)的高保真純正弦波逆變器1

設計方案基于功放專(zhuān)用驅動(dòng) 芯片高保真正弦波逆變器 | 2009-07-06

am29lv160db芯片燒寫(xiě)/擦除判斷位d7不夠可靠?!

seasoblue | 2002-05-24

英媒：符合美國監管要求背景下，英偉達擬再推“中國特供”芯片

智能計算英偉達特供芯片人工智能 | 2025-05-26

軟硬件都實(shí)現自主可控，華為鴻蒙電腦搭載麒麟 X90 芯片

EDA/PCB 華為鴻蒙電腦麒麟 X90 芯片 | 2025-05-26

莫迪預告首款印度造芯片問(wèn)世：將在印東北部地區半導體工廠(chǎng)下線(xiàn)

EDA/PCB 莫迪印度芯片半導體 | 2025-05-27

美國芯片巨頭英特爾、美光、高通和德州儀器均已向美國商務(wù)部提交評論，尋求減輕預期美國半導體進(jìn)口關(guān)稅的負擔或獲得免稅。

國際視野美國芯片半導體產(chǎn)業(yè) 關(guān)稅 | 2025-05-27

用MAX610系列AC／DC芯片構成的小功率無(wú)變壓器穩壓電源

設計方案 MAX610 系列芯片構成功率變壓器穩壓電源 | 2009-07-06

[原創(chuàng )]集成光學(xué)/IC模塊 -- 將系統級芯片提高到新水平

Gao | 2002-07-01

基于D類(lèi)功放專(zhuān)用驅動(dòng)芯片驅動(dòng)的高保真純正弦波逆變器

設計方案基于功放專(zhuān)用驅動(dòng) 芯片高保真正弦波逆變器 | 2009-07-06

英偉達新款中國特供芯片：放棄Cowos封裝和HBM

英偉達芯片 Cowos 封裝 HBM | 2025-05-27

小米自研3nm“大芯片”已開(kāi)始大規模量產(chǎn)

小米自研 3nm 芯片 | 2025-05-20

小米雷軍：芯片團隊已具備相當強的研發(fā)設計實(shí)力

EDA/PCB 小米雷軍芯片玄戒 O1 處理器 ARM 3nm | 2025-05-27

先進(jìn)的鋰電池線(xiàn)性充電管理芯片BQ2057充電電路

設計方案先進(jìn) 鋰電池線(xiàn)性充電管理芯片 BQ2057 電路 | 2009-07-06

國產(chǎn)半導體重大并購，能否實(shí)現算力突圍？

智能計算海光信息中科曙光 AI 算力 CPU 服務(wù)器芯片 | 2025-05-27

Dallas實(shí)時(shí)時(shí)鐘（RTC)芯片DS1306硬件手冊

資源下載 MAXIM INTEGRATED PRODUCTS Dallas 實(shí)時(shí)時(shí)鐘（RTC)芯片 DS1306 | 2007-02-09

ep7312芯片原理及應用

資源下載 Cirrus Logic 公司 ARM 芯片 EP7312 嵌入式內存映射 | 2007-02-16

經(jīng)驗點(diǎn)滴之二：燒寫(xiě)器PICKIT

jackwang | 2002-06-19

DS2413 1-Wire 雙通道尋址開(kāi)關(guān)

資源下載 Maxim 雙通道尋址開(kāi)關(guān) DS2413 1-Wire 芯片 | 2007-03-20

可編程快速充電管理芯片MAX712/ MAX713電路

設計方案可編程快速充電管理芯片 MAX712 MAX713 | 2009-07-06

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>