<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 編輯觀(guān)點(diǎn) > 亞馬遜的造芯「野望」

亞馬遜的造芯「野望」

作者：陳玲麗時(shí)間：2024-12-12 來(lái)源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

據悉，亞馬遜（AWS）推出了第三代AI訓練芯片Trainum3，是首款采用3nm工藝節點(diǎn)制造的AWS芯片，首批實(shí)例預計將于2025年底上市。

本文引用地址：http://dyxdggzs.com/article/202412/465450.htm

自從2018年推出基于A(yíng)rm架構的CPU Graviton以來(lái)，亞馬遜一直致力于為客戶(hù)開(kāi)發(fā)自研的芯片產(chǎn)品，Trainium是專(zhuān)門(mén)為超過(guò)1000億個(gè)參數模型的深度學(xué)習訓練打造的機器學(xué)習芯片。在2024年re:Invent大會(huì )上，AWS宣布Trainium2正式可用，其性能比第一代產(chǎn)品提升4倍，可以在極短的時(shí)間內訓練基礎模型和大語(yǔ)言模型。

亞馬遜發(fā)起新挑戰

亞馬遜將推出由數十萬(wàn)顆自研Trainium芯片組成的超級算力集群，該集群將落地美國，2025年建成后將成為世界上最大的人工智能模型訓練集群之一。凸顯了亞馬遜此前對自研芯片Trainium的承諾 —— 將Trainium視為替代英偉達GPU的備選選項，掌握更多的主動(dòng)權有利于減少對英偉達的依賴(lài)，為客戶(hù)降低成本。

該芯片集群將供由AI初創(chuàng )公司Anthropic使用。在2024年re:Invent全球大會(huì )上，Anthropic的聯(lián)合創(chuàng )始人兼首席計算官Tom Brown宣布了「雷尼爾計劃」（Project Rainier），該算力集群就是其中的核心布局。

Anthropic是亞馬遜投資的AI初創(chuàng )公司：2023年9月，亞馬遜向Anthropic投資40億美元；今年11月，亞馬遜再次向Anthropic追加40億美元投資。在融資聲明中，Anthropic強調雙方將合作開(kāi)發(fā)Neuron軟件，它類(lèi)似于芯片與AI模型之間的結締組織（connective tissue），直接對標英偉達CUDA。

此舉背后，通過(guò)投資的方式將自研芯片和Anthropic深度綁定，我們可以看到亞馬遜在大模型上更大的野心。Anthropic推出的Claude系列模型也已集成在A(yíng)mazon Bedrock中，從模型能力上看，Claude系列模型是目前市面上幾乎少數可以和OpenAI旗下GPT-4對標的模型。

為了爭奪更多有大模型和云計算使用需求的客戶(hù)，亞馬遜選擇聯(lián)合Anthropic是對標微軟+OpenAI的模式。微軟Azure的收入增長(cháng)，有不少是來(lái)自微軟提供的GPT-4入口，這意味著(zhù)OpenAI走紅后，其為微軟的云服務(wù)Azure帶來(lái)了更多新增客戶(hù)，亞馬遜也可以復制這種模式，即利用AI大模型帶來(lái)的增量尋求更多的市場(chǎng)份額。

據Synergy Research Group最新公布的數據估算，2024年第三季度，亞馬遜在全球云基礎設施市場(chǎng)的市場(chǎng)份額達到31%，領(lǐng)先于微軟Azure平臺的20%和谷歌云的11%。

亞馬遜展現出了其在芯片互聯(lián)技術(shù)上的獨特優(yōu)勢，秘密武器是其網(wǎng)絡(luò )技術(shù)NeuronLink，這項技術(shù)可以使所有四個(gè)服務(wù)器相互通信。與英偉達基于Blackwell架構芯片打造的服務(wù)器相比，能夠更靈活地將更多芯片連接在一起，從而大幅度提升運算速度，為用戶(hù)帶來(lái)更加流暢、高效的AI運算體驗。

值得一提的是，蘋(píng)果作為科技行業(yè)的巨頭，也選擇了與亞馬遜AWS合作，采用其定制的AI芯片來(lái)支持其搜索等關(guān)鍵服務(wù)。蘋(píng)果機器學(xué)習與人工智能高級總監貝諾伊·杜平（Benoit Dupin）表示蘋(píng)果內部正在測試Trainium2芯片，預計可節省約50%的成本。同時(shí)，蘋(píng)果還在積極評估最新的AI芯片是否可用于預訓練其Apple Intelligence模型，這無(wú)疑為AWS的AI芯片技術(shù)注入了更多的期待和可能性。

歷數亞馬遜云科技如今的自研產(chǎn)品陣容不難發(fā)現，他們已經(jīng)擁有包括通用處理器Graviton、AI訓練芯片Amazon Trainium、AI推理芯片Amazon Inferentia，以及網(wǎng)絡(luò )系統Nitro在內的至少四大類(lèi)自研硬件/芯片家族。

根據云成本管理和優(yōu)化平臺Vantage的一項調查顯示，在實(shí)例類(lèi)型的成本支出方面，在2024第一季度的Amazon EC2 M7系列通用實(shí)例類(lèi)型上，采用Graviton的M7g系列達到了34.5%；到了2024年第二季度，在A(yíng)mazon RDS、Amazon ElastiCache和Amazon OpenSearch托管服務(wù)所采用的實(shí)例類(lèi)型中，Graviton已經(jīng)超越了Intel。

不難看出，作為持續的行業(yè)領(lǐng)導者，亞馬遜云科技不只是擁有客觀(guān)上更多的自研芯片種類(lèi)。更為重要的是，他們是真的將自研芯片投入到了主力云計算業(yè)務(wù)中，并已取得了客觀(guān)上的巨大成功。

亞馬遜自研芯片的優(yōu)勢

在云廠(chǎng)商自研芯片的浪潮中，亞馬遜無(wú)疑是最早踐行這一趨勢的先驅?zhuān)河布匝兄肥加?012年，并且從2013年就被確立為重要的業(yè)務(wù)策略，同年研發(fā)出了第一款自研芯片Nitro。

Nitro并非如今的通用處理器或AI芯片，它本質(zhì)上其實(shí)是一個(gè)專(zhuān)用硬件系統，主要用于高性能網(wǎng)絡(luò )處理和虛擬化卸載，將服務(wù)器的更多CPU算力解放出來(lái)、讓這些CPU性能能夠被更多客戶(hù)所使用。

亞馬遜自主完成的所有自研芯片均由Annapurna Labs團隊設計和制造。Annapurna Labs是亞馬遜于2015年收購的半導體微電子公司，早在收購之前，雙方就在Nitro系統的開(kāi)發(fā)方面緊密合作。目前，Annapurna Labs團隊成員分布在全球多個(gè)地點(diǎn)，包括以色列的特拉維夫、加拿大的多倫多，以及德克薩斯州奧斯汀的實(shí)驗室。

亞馬遜的自研硬件更是成為了其云服務(wù)性?xún)r(jià)比不斷攀升背后的重要因素。2021年P(guān)rime Day期間，亞馬遜首次使用Amazon Graviton2支持的Amazon EC2實(shí)例；2024年P(guān)rime-Day期間，亞馬遜使用了超過(guò)25萬(wàn)個(gè)Graviton芯片為超過(guò)5800種不同的亞馬遜電商服務(wù)提供支持。

自從2006年推出第一代公有云服務(wù)以來(lái)，亞馬遜至今已主動(dòng)降價(jià)100次以上，甚至有時(shí)降價(jià)幅度極其巨大。比如就在今年10月，亞馬遜云科技剛剛宣布將Amazon DynamoDB按需吞吐量的價(jià)格降低50%、將全球表（Global Tables）的價(jià)格降低多達67%。很顯然，這種持續、主動(dòng)的降價(jià)行為，很大程度是得益于了亞馬遜的自研硬件體系。

亞馬遜自己也受益于自研芯片“性?xún)r(jià)比”所帶來(lái)的規模優(yōu)勢。此前亞馬遜云科技副總裁Jeff Barr曾展示了一張Graviton4開(kāi)發(fā)時(shí)的實(shí)例集群快照，充分利用自研處理器的規模優(yōu)勢，使用了多達數十萬(wàn)個(gè)內核加速EDA電子設計自動(dòng)化流程，峰值規模為正常使用規模的5倍。

隨著(zhù)生成式AI需求的持續增長(cháng)，芯片將會(huì )成為爭奪AI霸權的下一個(gè)戰場(chǎng)。在A(yíng)I硬件領(lǐng)域，英偉達的確獨霸天下。無(wú)數人在問(wèn)：在未來(lái)幾個(gè)月甚至幾年內英偉達還能保持高增長(cháng)嗎？競爭對手能不能找到辦法縮小差距？

除了亞馬遜，還有很多廠(chǎng)商正在開(kāi)發(fā)自己的AI芯片，比如微軟、Meta、OpenAI、谷歌、AMD、英特爾。年初時(shí)有消息稱(chēng)，英特爾、高通、谷歌及其它一些科技企業(yè)準備聯(lián)手應戰，合作圍繞軟件展開(kāi)。但英偉達CUDA的地位不是一夜之間可以撼動(dòng)的，不單只是軟件能力，還以為它15年的使用歷史，現在許多代碼是圍繞CUDA開(kāi)發(fā)的，CUDA與很多AI及高性能計算項目深度連接在一起。

值得注意的是，AI半導體市場(chǎng)實(shí)際上分成兩大塊 —— 訓練和推理，數據中心用GPU訓練AI，推理發(fā)生在服務(wù)器或者邊緣設備上。在訓練市場(chǎng)，英偉達占據98%的市場(chǎng)份額，這種優(yōu)勢短期內不會(huì )消失，因此邊緣AI推理市場(chǎng)是競爭對手可以重點(diǎn)關(guān)注的領(lǐng)域。

其中NPU（Neural Processing Units）就是部分廠(chǎng)商的研究重點(diǎn)，它的能耗更低、更加專(zhuān)業(yè)化。NPU能加速處理AI任務(wù)，包括深度學(xué)習和推理任務(wù)，并行處理海量數據，還可以用專(zhuān)門(mén)的片上存儲器快速執行復雜的人工智能算法，以實(shí)現高效數據存儲和檢索。雖然GPU處理能力更強、功能更多，但NPU更小、更便宜、更節能，在執行專(zhuān)業(yè)AI任務(wù)時(shí)，由于NPU采用特殊架構，性能反而有可能高于CPU。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 亞馬遜 AI 芯片微軟 OpenAI 英偉達

評論

相關(guān)推薦

意法半導體擴大對亞馬遜FreeRTOS的支持，推出集成藍牙?、以太網(wǎng)、LTE Cat-M / NB-IoT的開(kāi)發(fā)入門(mén)套件

EEPW | 2018-12-18

涉嫌違反反壟斷法英偉達被立案調查

智能計算英偉達反壟斷法 AI GPU | 2024-12-10

臺積電據稱(chēng)正與英偉達洽談擬在亞利桑那州工廠(chǎng)生產(chǎn)Blackwell芯片

EDA/PCB 臺積電英偉達 Blackwell 芯片聊天機器人 | 2024-12-06

OpenAI正式推出AI視頻生成模型Sora

智能計算 openAI Sora 文生視頻 | 2024-12-11

英偉達展望未來(lái) AI 加速器：集成硅光子 I/O，3D 垂直堆疊 DRAM 內存

智能計算英偉達硅光子內存 | 2024-12-10

競爭加??！報道：亞馬遜勸說(shuō)云客戶(hù)遠離英偉達，改用自家芯片

智能計算亞馬遜云客戶(hù) 英偉達，AI芯片 | 2024-12-06

亞馬遜amazon新電子書(shū) Kindle Paperwhite拆解

zhuwei0710 | 2013-06-19

開(kāi)發(fā)了一套基于亞馬遜AWS的連云聲控方案

丘球 | 2021-02-20

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（1）

視頻英偉達嵌入式 ARM 軟銀 | 2023-11-06

亞馬遜的造芯「野望」

亞馬遜 AI 芯片微軟 OpenAI 英偉達 | 2024-12-12

亞馬遜Kindle Fire全拆解

zhuwei0710 | 2013-05-17

可用于冷卻英偉達 GB200 NVL72，Nidec 向超微交付全球首款 4U 250kw CDU

網(wǎng)絡(luò )與存儲尼得科英偉達制冷 | 2024-12-06

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（2）

視頻 AI 英偉達 ARM | 2023-11-07

OpenAI首席財務(wù)官：向企業(yè)收取每月數千美元訂閱費是合理的

智能計算 OpenAI 訂閱費 AI 軟件 | 2024-12-11

OpenAI推o1模型完整版，還有月費200美元新服務(wù)

智能計算 OpenAI o1模型 ChatGPT 圖像分析功能 | 2024-12-06

亞馬遜跨境電商招聘產(chǎn)品與項目人員

leephen | 2020-11-20

大嘴業(yè)話(huà)——英偉達宣布進(jìn)軍CPU市場(chǎng)

視頻英偉達 AI CPU | 2023-11-10

《E點(diǎn)冷知識》：引發(fā)AI行業(yè)大地震的CUDA究竟有多強大

視頻英偉達 GPU CUDA AI | 2024-03-26

OpenAI正式發(fā)布AI視頻生成工具Sora，Plus用戶(hù)每月可生成50條

智能計算 OpenAI AI Sora Plus用戶(hù) | 2024-12-10

GPU的形態(tài)已徹底改變，英偉達GTC大會(huì )發(fā)布的到底是什么

視頻英偉達 GPU Blackwell AI GTC | 2024-03-26

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>