傳導致英偉達股價(jià)暴跌的DeepSeek擁有5萬(wàn)顆GPU
初創(chuàng )公司 DeepSeek 異軍突起站在了AI大舞臺的聚光燈下,根據DeepSeek披露的DeepSeek-V3 Mixture-of-Experts (MoE) AI模型具有極為微小硬件要求(該公司聲稱(chēng) DeepSeek 的訓練成本僅為 600 萬(wàn)美元和 2048 個(gè) GPU),與現有美國的AI模型相比,對成本開(kāi)銷(xiāo)的要求要低得多,在性能上R1 AI模型據估計具有與Open AI的o1同等水平的競爭力,這引發(fā)了整個(gè)AI業(yè)界的地震,直接導致美國主要AI硬件企業(yè)總市值下跌近萬(wàn)億美元,首當其沖的是英偉達下跌超過(guò)15%。
雖然DeepSeek的橫空出世重創(chuàng )了最近一兩年因為AI高資本支出帶來(lái)股價(jià)倍增的美國眾多AI芯片公司,但隨著(zhù)放大鏡下DeepSeek算力池浮出水面,AI對高基礎設施支出的預期似乎有所回調。
行業(yè)分析公司 SemiAnalysis 報告稱(chēng),DeepSeek 背后的公司可能承擔了 16 億美元的硬件成本,并擁有 50,000 個(gè) Nvidia Hopper GPU 算力陣列,這一發(fā)現削弱了 DeepSeek 以比 AI 行業(yè)現有領(lǐng)導者低得多的投資重塑 AI 訓練和推理的想法。報告稱(chēng),DeepSeek 運營(yíng)著(zhù)一個(gè)擁有大約 50,000 個(gè) Hopper GPU 的廣泛計算基礎設施。根據 SemiAnalysis 的數據,這包括 10,000塊H800 和 10,000塊H100,以及額外購買(mǎi)的 H20 設備。這些資源分布在多個(gè)位置,用于 AI 訓練、研究和財務(wù)建模等目的。根據 SemiAnalysis 的數據,該公司在服務(wù)器方面的總資本投資約為 16 億美元,估計用于運營(yíng)成本的支出為 9.44 億美元。
DeepSeek的走紅迅速將自己曝光在全球科技媒體的聚光燈下,據公開(kāi)資料顯示,DeepSeek起源于中國對沖基金幻方High-Flyer,該公司很早就采用了 AI用于對投資市場(chǎng)的判斷,并在 GPU 上投入了大量資金。2023 年,幻方推出了專(zhuān)注于 AI 的獨立企業(yè) DeepSeek,與許多競爭對手不同,DeepSeek保持自籌資金,使其在決策方面具有靈活性和速度。據 SemiAnalysis 稱(chēng),盡管聲稱(chēng)它是一個(gè)子公司,但幻方已在相關(guān)技術(shù)上投資了超過(guò) 5 億美元。
對于大部分AI初創(chuàng )公司來(lái)說(shuō),沒(méi)有雄厚的資本去構建自己的數據中心,因此幾乎大部分動(dòng)作都會(huì )被暴露在公眾視野中。異軍突起的DeepSeek與這些競爭者一個(gè)主要區別在于它能夠運行自己的數據中心,相比于大多數其他依賴(lài)外部云提供商的AI初創(chuàng )公司,這種獨立性允許完全控制實(shí)驗和 AI 模型優(yōu)化。此外,它支持快速迭代,沒(méi)有外部瓶頸,與業(yè)內傳統參與者相比,DeepSeek開(kāi)發(fā)和訓練的效率更高。
此外,SemiAnalysis還發(fā)現一個(gè)特別之處,相比于其他AI企業(yè)挖角美國或中國臺灣的AI成熟專(zhuān)家,DeepSeek只從中國境內招聘(重點(diǎn)在北京大學(xué)和浙江大學(xué)),專(zhuān)注于技能和解決問(wèn)題的能力,而不是曾經(jīng)取得的證書(shū)和成就。根據調查,DeepSeek 的一些 AI 研究人員的收入超過(guò) 130 萬(wàn)美元,超過(guò)了Moonshot等其他領(lǐng)先的中國 AI 公司的薪酬。之所以SemiAnalysis關(guān)注人才結構,因為該公司經(jīng)過(guò)調查發(fā)現,得益于人才流入DeepSeek 率先推出了多頭潛在注意力 (MLA) 等創(chuàng )新,這需要數月的開(kāi)發(fā)和大量 GPU 使用。DeepSeek 強調效率和算法改進(jìn),而不是暴力擴展,重塑了人們對 AI 模型開(kāi)發(fā)的期望。出于多種原因,這種方法使一些人認為快速發(fā)展可能會(huì )減少對高端 GPU 的需求,從而影響英偉達等公司。
雖然DeepSeek 宣稱(chēng)只用了 600 萬(wàn)美元就訓練了其最新模型,這個(gè)成本無(wú)異于給整個(gè)AI產(chǎn)業(yè)扔下了一枚“老男孩”。但是,這個(gè)數字應該僅是指該模型總訓練成本的一部分,具體來(lái)說(shuō)就是預訓練所需的GPU 時(shí)間開(kāi)銷(xiāo)成本,應該沒(méi)有考慮研究、模型優(yōu)化、數據處理或整體基礎設施費用。據估計,自成立以來(lái)DeepSeek在A(yíng)I開(kāi)發(fā)上花費了超過(guò)5億美元,特別一點(diǎn),SemiAnalysis 認為,與官僚主義背負重擔的某些公司和受募資牽制不得不高調的某些公司相比,DeepSeek 的精益結構使其能夠積極推進(jìn) AI 創(chuàng )新。DeepSeek 的成功建立在數十億美元的戰略投資、技術(shù)突破和有競爭力的員工隊伍之上。這意味著(zhù)沒(méi)有奇跡,DeepSeeK的出現也并不是英偉達的末日。正如埃隆·馬斯克 (Elon Musk) 一年左右前指出的那樣,如果你想在 AI 領(lǐng)域保持競爭力,你必須每年花費數十億美元,據報道,這正處于支出的范圍內。
作為美國重要的戰略產(chǎn)業(yè),AI基礎設施中的芯片一直是美國對中國管制的焦點(diǎn)。DeepSeek據稱(chēng)擁有英偉達5萬(wàn)顆GPU(大部分在2023美國發(fā)布的禁運令名單中),引發(fā)外界質(zhì)疑其是否透過(guò)新加坡中介商取得美國出口管制的芯片。英偉達最新季報顯示,新加坡約占其營(yíng)收22%。 英偉達提交給監管機構的文件透露,與新加坡業(yè)務(wù)相關(guān)的大部分出貨都運往新加坡以外的其他地區,運抵新加坡的數量極為稀少。加上之前新加坡的芯片公司被臺積電拉黑,據傳是為中國某企業(yè)代理下單7nm工藝AI芯片,新加坡未來(lái)將成為AI芯片管制一個(gè)新的熱點(diǎn)。
評論