全球最小AI「桌面超算」發(fā)布,英偉達B端C端兩手抓
每年在美國拉斯維加斯舉辦的國際消費電子展(CES)是科技圈最重要的盛會(huì )。今年,英偉達創(chuàng )始人兼首席執行官黃仁勛發(fā)表開(kāi)幕主題演講,推出了多款新品 —— GeForce RTX 50系列GPU、支持機器人開(kāi)發(fā)的世界模型Cosmos,以及一臺被他稱(chēng)作“世界上最小的個(gè)人超級計算機”P(pán)roject Digits。
本文引用地址:http://dyxdggzs.com/article/202501/466169.htm1993年,英偉達創(chuàng )立后經(jīng)歷了多個(gè)重要時(shí)間節點(diǎn):1999年,發(fā)布世界首款GPU產(chǎn)品;2006年,推出GeForce 8800 Ultra顯卡,并提出CUDA(統一計算架構)這一概念,引領(lǐng)了后續的GPU算力發(fā)展。在AI領(lǐng)域,英偉達在十多年前就已經(jīng)洞察到AI的影響力,并一路伴隨著(zhù)AI行業(yè)的發(fā)展。
亮相即“王炸”
GeForce RTX 50系列GPU中最受矚目的GeForce RTX 5090,是英偉達目前最強大的顯卡,其速度是其前身RTX 4090的兩倍。新一代基于Blackwell架構的RTX 5090晶體管數量從上一代的763億(Ada Lovelace架構)提升至920億,可提供3400 TOPS算力,具備4000 AI TOPS(每秒萬(wàn)億次操作)的性能。
此次英偉達公布了RTX 5090、RTX 5080、RTX 5070 Ti、RTX 5070四款桌面平臺GPU和對應的四款移動(dòng)平臺GPU。RTX 5070、RTX 5070 Ti、RTX 5080和RTX 5090的售價(jià)分別為:549美元、749美元、999美元和1999美元;而搭載RTX 5090、RTX 5080、5070 Ti和5070的筆記本售價(jià)分別為2899、2199、1599和1299美元,預計將于三月份上市。
黃仁勛特別提到,售價(jià)僅549美元的RTX 5070顯卡的性能將足以媲美去年推出的RTX 4090 GPU,而后者的售價(jià)高達1600美元。黃仁勛直言:“沒(méi)有人工智能,這是不可能實(shí)現的”。到了AI時(shí)代,傳統基于CPU的說(shuō)明式硬編碼開(kāi)發(fā)模式,也應該轉型為基于GPU、機器學(xué)習與神經(jīng)網(wǎng)絡(luò )的AI模式。而強大的GPU,正是這一轉變的起點(diǎn)。
值得注意的是,由于美國出口管制,英偉達無(wú)法在中國市場(chǎng)銷(xiāo)售RTX 5090,取而代之是RTX 5090D,定價(jià)16499元。和RTX 5090相比,RTX 5090D擁有2375AI TOPS算力,是RTX 5090的70%,是RTX 4090D的200%。
在RTX 50系顯卡上,英偉達同步推出了最新一代的DLSS 4。簡(jiǎn)單來(lái)說(shuō),DLSS 4改用了由英偉達超級計算機訓練的全新Transformer AI模型,提升了DLSS 4的渲染精度和穩定性,從而為用戶(hù)提供更好的畫(huà)面和更高的分辨率。另外,基于第五代Tensor Core的能力,RTX 50系列的DLSS多幀生成技術(shù)取代了RTX 40系列的DLSS幀生成,可以為每一個(gè)實(shí)際渲染幀額外生成最多3幀畫(huà)面,這對游戲平均幀率有相當顯著(zhù)的提升。
全新物理AI模型Cosmos
此外,英偉達還宣布推出Cosmos平臺,集成了先進(jìn)的生成式世界基礎模型(WFM)、高級分詞器、護欄系統和加速的視頻處理管道,這個(gè)平臺被稱(chēng)為加速「物理AI」發(fā)展的關(guān)鍵一步,將極大地推動(dòng)自動(dòng)駕駛和機器人等對物理場(chǎng)景要求較高的領(lǐng)域邁向更高水平。
物理AI(也稱(chēng)為生成式物理AI)是一種使自主機器能夠在真實(shí)物理世界中感知、理解和執行復雜交互操作的技術(shù)。它擴展了傳統的生成式AI,使其能夠理解3D世界的空間關(guān)系和物理行為,通俗地理解就是人工智能反饋的內容要符合物理規律。例如,傳統的機器人只能按照預設程序執行任務(wù),而搭載物理AI的機器人則能夠更好地識別物體、預測運動(dòng)軌跡、并根據物理規律做出相應的反應。
“物理AI將徹底改變價(jià)值50萬(wàn)億美元的制造業(yè)和物流業(yè),”黃仁勛在本次CES國際消費電子展上表示,從汽車(chē)、卡車(chē)到工廠(chǎng)、倉庫,所有移動(dòng)的事物都將實(shí)現機器人化并由AI驅動(dòng),強調AI的新一波浪潮是物理AI。
物理AI的開(kāi)發(fā)極為復雜,需要海量的真實(shí)世界數據和長(cháng)時(shí)間的測試,開(kāi)發(fā)成本高昂。而英偉達的Cosmos平臺使用了NeMo Curator框架以及CUDA加速數據處理流水線(xiàn),在14天內即可完成對2000萬(wàn)小時(shí)視頻的處理工作,而這一任務(wù)在傳統CPU環(huán)境下需要3.4年。
英偉達構建了一個(gè)完整的物理AI生態(tài)系統,包含以Omniverse、Cosmos、Isaac Sim等關(guān)鍵組成部分。開(kāi)發(fā)者可以利用Omniverse創(chuàng )建虛擬的三維場(chǎng)景,再由Cosmo生成如同高度擬真的訓練場(chǎng)景,其中Cosmos WFMs能夠快速生成基于真實(shí)物理規律的高仿真數據,降低依賴(lài)昂貴現實(shí)數據的需求。這些模型通過(guò)將文本、圖像、視頻以及機器人傳感器數據結合,生成多樣化的物理環(huán)境場(chǎng)景,比如雪地駕駛、擁擠倉庫等。
Cosmos模型將有三種尺寸:Nano、Super和Ultra。英偉達表示Cosmos模型會(huì )以開(kāi)放模型許可的方式發(fā)布,開(kāi)發(fā)者可以通過(guò)NVIDIA API目錄預覽首批模型,或從NVIDIA NG目錄或Hugging Face下載完整的模型家族和微調框架。目前,多家領(lǐng)先的機器人和汽車(chē)公司,包括1X、Agile Robots、以及汽車(chē)共享巨頭Uber,已成為首批采用Cosmos平臺的企業(yè),或許機器人也即將迎來(lái)“ChatGPT時(shí)刻”。
可以說(shuō)Cosmos的發(fā)布,補全了英偉達物理AI體系中“理解世界”的重要一環(huán)。從此次發(fā)布的產(chǎn)品來(lái)看,英偉達在A(yíng)I領(lǐng)域的進(jìn)度已經(jīng)甩掉同行一大截,而在CUDA、Tensor的“封鎖下”,英偉達還將繼續引領(lǐng)高算力AI平臺,乃至整個(gè)AI行業(yè)的發(fā)展,成為AI產(chǎn)業(yè)名副其實(shí)的“柱石”。
全球最小的個(gè)人AI超算
2025年,AI已經(jīng)成為了科技發(fā)展的主戰場(chǎng),昂貴、龐大的AI超算,從某種程度上其實(shí)也阻礙了AI的進(jìn)步。對此,黃仁勛帶來(lái)了英偉達的「One More Thing」 —— Project Digits桌面AI超級計算機。
核心方面,Project Digits搭載的GB10超級芯片由Blackwell CPU和Grace CPU組成,其中Grace CPU包含20個(gè)ARM核心。同時(shí),Project Digits也配備了128GB LPDDR5X內存和4TB SSD。另外,Project Digits除了可以單獨使用,還可以?xún)蓚€(gè)單元疊加使用,疊加狀態(tài)下甚至可以運行超過(guò)4000億參的模型。
其實(shí),市場(chǎng)一直關(guān)注英偉達在PC領(lǐng)域的動(dòng)作。早在2023年年底,路透社就曝光過(guò)英偉達正在秘密研發(fā)一款基于A(yíng)RM架構的PC CPU,支持Windows操作系統,進(jìn)軍個(gè)人電腦領(lǐng)域與英特爾、AMD的“x86聯(lián)盟”競爭;2024年10月,臺灣經(jīng)濟時(shí)報又爆出來(lái)自中國臺灣供應鏈方面的消息,表示英偉達將與聯(lián)發(fā)科合作設計一款基于3nm的PC CPU,2025年進(jìn)軍PC CPU領(lǐng)域。
但是Project Digits與先前爆料的PC CPU并非同一款產(chǎn)品。無(wú)論是功能還是目標用戶(hù),Project Digits定位上更接近于蘋(píng)果Mac和微軟Surface旗下的工作站計算機,而非一般意義上的個(gè)人電腦。黃仁勛表示:“我們將AI超級計算機放在每個(gè)數據科學(xué)家、AI研究人員和學(xué)生的辦公桌上,使他們能夠參與和塑造AI時(shí)代?!?/strong>
這個(gè)產(chǎn)品本身尺寸類(lèi)似Mac Mini,可以放在桌子上并使用標準電源插座供電,既能夠用作小型工作站,也可以與現有PC配合使用。根據英偉達介紹,Project Digits定價(jià)3000美元,最快5月上市。但值得關(guān)注的是,英偉達在官方聲明中提到了與聯(lián)發(fā)科的合作,稱(chēng)聯(lián)發(fā)科參與了GB10的設計,“在能效、性能和互連上做出了貢獻”。
期待更高的重磅產(chǎn)品“缺席”?
英偉達通常會(huì )在CES展會(huì )上發(fā)布重要的產(chǎn)品公告,許多投資者希望獲得Blackwell更具體的進(jìn)展信息,以及對下一代數據中心GPU架構Rubin的更多介紹。但CES是消費電子產(chǎn)品的主場(chǎng),黃仁勛在演進(jìn)中并未透露更多數據中心產(chǎn)品業(yè)務(wù)線(xiàn)的信息,只提到“Blackwell已全面投入生產(chǎn)”。
此前,英偉達在2024年11月的財報電話(huà)會(huì )議中確認,Blackwell芯片的生產(chǎn)已在本季度加速,預計將提前向客戶(hù)發(fā)貨。市場(chǎng)預期,這些芯片將推動(dòng)英偉達產(chǎn)品需求進(jìn)入一個(gè)新的增長(cháng)周期。2024年8月,其首款產(chǎn)品B200 GPU被曝存在設計缺陷,遇到了散熱、封裝緊缺等一系列工程難題,市場(chǎng)當時(shí)緊張猜測英偉達是否會(huì )延遲交貨。
雖然在這次CES上沒(méi)有等到更多相關(guān)的爆料,但根據英偉達的規劃,本月月底即將發(fā)布的第四財季財報與3月要舉辦的GTC大會(huì ),才是英偉達回到主場(chǎng)的重頭戲。
近年來(lái),摩爾定律的發(fā)展速度有所放緩。然而,黃仁勛聲稱(chēng),英偉達的AI芯片正以自身的加速節奏發(fā)展,“我們可以同時(shí)構建架構、芯片、系統、庫和算法,如果這樣做,我們就能比摩爾定律更快地發(fā)展,因為我們可以在整個(gè)技術(shù)棧中進(jìn)行創(chuàng )新”,性能提升速度已遠超數十年來(lái)推動(dòng)計算機技術(shù)進(jìn)步的摩爾定律設定的標準,AI世界正以「超摩爾定律」的速度發(fā)展。
黃仁勛還強調,隨著(zhù)計算能力的提升,AI推理成本將逐步降低,類(lèi)似于摩爾定律推動(dòng)計算成本下降的歷史進(jìn)程。英偉達最新的數據中心超級芯片GB200 NVL72,在運行AI推理工作負載方面的速度比H100快30-40倍,成本將隨著(zhù)時(shí)間的推移而降低,預計這種趨勢將隨著(zhù)AI推理模型的發(fā)展而繼續下去。
評論