OpenAI裝都不裝了,提案要求禁用DeepSeek
中國大模型公司杭州深度求索(DeepSeek)發(fā)布的開(kāi)源模型DeepSeek-R1如同一股颶風(fēng),在市場(chǎng)掀起巨浪。DeepSeek之所以火爆科技圈,關(guān)鍵在于其只需要使用比OpenAI-o1低90%至95%的API調用成本,就可以在數學(xué)、編程和推理等關(guān)鍵領(lǐng)域達到與OpenAI-o1相媲美的表現。
本文引用地址:http://dyxdggzs.com/article/202503/468386.htm彭博社這樣描述DeepSeek-R1模型引起的轟動(dòng)效應:“這一潛在威脅動(dòng)搖了美國科技公司的行業(yè)領(lǐng)先地位,導致與AI相關(guān)的科技股大跌,包括微軟、英偉達、甲骨文以及谷歌母公司Alphabet?!苯刂?月27日,這些公司的市值合計蒸發(fā)近1萬(wàn)億美元。
DeepSeek打破刻板印象
2024年12月26日,DeepSeek-V3首個(gè)版本上線(xiàn)并同步開(kāi)源,總參數達6710億,采用創(chuàng )新的MoE(Mixture of Experts,混合專(zhuān)家)架構和FP8混合精度訓練,公布了長(cháng)達53頁(yè)的訓練和技術(shù)細節;2025年1月20日,新一代推理模型型DeepSeek-R1發(fā)布,部分性能與OpenAI的GPT-4o正式版持平。近期,DeepSeek也發(fā)布了圖像模型Janus pro,但是效果一般,在多模態(tài)的領(lǐng)域,開(kāi)源還有更長(cháng)的路要走。
DeepSeek-R1的開(kāi)源及其后續的商業(yè)化部署,引起了全球用戶(hù)和開(kāi)發(fā)者的廣泛關(guān)注,尤其是在資本市場(chǎng)上的影響力不容小覷。從技術(shù)路徑來(lái)看,DeepSeek最大的優(yōu)勢在于,通過(guò)算法優(yōu)化和資源調配,減少了大語(yǔ)言模型(LLM)預訓練的時(shí)間。作為一個(gè)預訓練模型,它在某些重要任務(wù)上的表現已經(jīng)接近美國最先進(jìn)的模型,同時(shí)顯著(zhù)降低了訓練成本。
DeepSeek團隊通過(guò)一系列令人印象深刻的創(chuàng )新實(shí)現了這一突破,主要集中在提升工程效率方面 —— 在「鍵值緩存」(Key-Value cache)管理方面做出了特別創(chuàng )新的改進(jìn),并且將MoE方法推進(jìn)到了前所未有的水平。
在DeepSeek發(fā)表的原始報告中有詳細解釋這筆成本的計算:在預訓練階段,每兆個(gè)token上訓練DeepSeek-V3僅需要180K H800 GPU小時(shí),也就是說(shuō)在擁有2048個(gè)H800 GPU的叢集上需要3.7天。因此,預訓練階段在不到兩個(gè)月的時(shí)間內完成,耗費2664K GPU小時(shí)。加上上下文長(cháng)度擴充所需的119K GPU小時(shí)和后制訓練所需的5K GPU小時(shí),DeepSeek-V3的完整訓練僅需2.788M GPU小時(shí)。假設H800 GPU的租賃價(jià)格為每GPU小時(shí)2美元,總訓練成本僅為557.6萬(wàn)美元。而GPT-4o的約為1億美元,使用25000個(gè)GPU芯片。
推理成本上,OpenAI o1每百萬(wàn)輸入和百萬(wàn)輸出token分別收取15美元和60美元,而DeepSeek R1同樣輸入與輸出的價(jià)格分別只要0.55美元和2.19美元,差不多只是前者的3%。
不論是OpenAI還是其他頭部AI廠(chǎng)商都走的是“大力出奇跡”路線(xiàn),即通過(guò)堆大量算力來(lái)訓練大模型推理能力,但DeepSeek用有限的資源走了一條適合國內的路。與其討論DeepSeek能否成為“中國版”的OpenAI,不如說(shuō)DeepSeek其實(shí)挑戰了OpenAI的模式,畢竟OpenAI也并不一定是大模型的終局。
國外獨立評測機構Artificial Analysis測試了DeepSeek-V3后得出的結論:DeepSeek-V3超越了迄今為止所有開(kāi)源模型。需要注意的是,對比Android與iOS的生態(tài)隔離,開(kāi)源與閉源大模型均基于Transformer架構,差異是在數據、算法運用、工程等維度,并非是截然不同的技術(shù)路線(xiàn)。
DeepSeek不僅提升了國內AI技術(shù)的整體水平,還幫助開(kāi)發(fā)者和中小型大模型創(chuàng )業(yè)公司完成了AI市場(chǎng)教育。目前,DeepSeek-R1、V3、Coder等系列模型已正式上線(xiàn)國家超算互聯(lián)網(wǎng)平臺,這標志著(zhù)DeepSeek正式進(jìn)入“國家隊”,同時(shí)也代表著(zhù)一個(gè)基于國產(chǎn)深算智能加速卡的普惠、可靠AI大模型時(shí)代的到來(lái)。
OpenAI提案要求禁用DeepSeek
OpenAI首席執行官Sam Altman在社交平臺X上表示,“DeepSeek的R1是一款令人印象深刻的模型,尤其是考慮到它們能夠以這個(gè)價(jià)格提供的功能”。OpenAI在DeepSeek-R1模型發(fā)布后,為了維持其在A(yíng)I領(lǐng)域的領(lǐng)先地位,迅速發(fā)布了推理模型o3-mini,支持low、medium和high三種推理難度。另外,DeepSeek的崛起迫使OpenAI加速推出免費的搜索引擎功能以應對競爭,2025年2月6日,OpenAI宣布向所有用戶(hù)開(kāi)放ChatGPT搜索功能,并且無(wú)需注冊即可使用。
而隨后2025年3月13日,OpenAI全球事務(wù)副總裁Christopher Lehane向白宮科學(xué)技術(shù)政策辦公室(OSTP)提交了一份長(cháng)達15頁(yè)的政策建議報告,DeepSeek在報告中被點(diǎn)名15次。Christopher Lehane表示”盡管美國目前在人工智能領(lǐng)域保持領(lǐng)先,但DeepSeek表明我們的領(lǐng)先優(yōu)勢并不大,而且正在縮小”,同時(shí),聲稱(chēng)在關(guān)鍵基礎設施和其他高風(fēng)險應用中使用DeepSeek會(huì )「帶來(lái)重大風(fēng)險」,要求美國政府采取行動(dòng)。
OpenAI指控DeepSeek存在技術(shù)安全缺陷,R1模型架構“可能導致敏感任務(wù)失控”,威脅美國關(guān)鍵基礎設施。報告特別提及歐洲金融機構(如匯豐銀行)測試DeepSeek模型,警示盟友技術(shù)依賴(lài)轉移風(fēng)險,呼吁加強「民主AI供應鏈」審查。
提案中,強調當前美國面臨來(lái)自中國AI技術(shù)的“系統性挑戰”,建議參考拜登政府的出口規則,采取分級制度:第一級(Tier I)是“致力于民主人工智能原則的國家”,包括美國盟友,完全遵循美國技術(shù)標準,可以享受算力補貼與市場(chǎng)準入,但不能使用中國生產(chǎn)的設備以及“侵犯用戶(hù)隱私并存在知識產(chǎn)權盜竊等安全風(fēng)險的人工智能模型”;第二級(Tier II)是沒(méi)能阻止受出口管制的芯片被轉移到“第三級國家”的國家,需承諾安全審查后可升級至Tier I;第三級(Tier III)則是中國等國家,嚴格限制AI技術(shù)出口。
OpenAI這封信函實(shí)際上是響應《人工智能行動(dòng)計劃》的一份提案,今年2月美國政府為制定新的AI政策向外界公開(kāi)征求意見(jiàn)。今年1月,特朗普政府直接撤銷(xiāo)了先前美國的AI行政命令《安全、可靠和值得信賴(lài)的人工智能開(kāi)發(fā)與使用》,轉而迅速簽署了一項全新《人工智能行動(dòng)計劃》,要求在短短180天內提交一份AI行動(dòng)計劃,直言“美國矢志維持并鞏固其在全球人工智能領(lǐng)域的霸主地位”。
美國國會(huì )、海軍、五角大樓、NASA等政府機構和部門(mén)已經(jīng)紛紛對DeepSeek下達了禁令,甚至在今年1月29日發(fā)布《2025年美國人工智能能力與中國脫鉤法案》(Decoupling America’s Artificial Intelligence Capabilities from China Act of 2025)禁止美國人協(xié)助中國推動(dòng)AI,并禁止美國人下載或使用DeepSeek,否則將被定性為犯罪,最高可判處20年監禁及處以100萬(wàn)美元的罰款。彭博報道,已有數百家美國公司,尤其是與政府相關(guān)的企業(yè),都已經(jīng)屏蔽了DeepSeek。
曾幾何時(shí),OpenAI堪稱(chēng)開(kāi)源界的先鋒,從GPT-3開(kāi)始,畫(huà)風(fēng)突變,毅然筑起閉源的高墻,通過(guò)API訂閱制賺得是盆滿(mǎn)缽滿(mǎn),全然不顧曾經(jīng)的開(kāi)源初心。
OpenAI裝都不裝了
OpenAI提案中同時(shí)還呼吁美國聯(lián)邦政府應該幫助AI公司免受日益嚴苛的州級AI法規的影響,借機提出了真正的核心議題 —— 聯(lián)邦與州法規的博弈、版權數據使用的合法性爭議。
想要獲得州級法規豁免權
OpenAI建議建立一個(gè)范圍明確的框架,促成聯(lián)邦政府與私營(yíng)公司之間的自愿合作,在適當的情況下政府能夠從企業(yè)獲得經(jīng)驗和資源,而作為交換,私營(yíng)公司則能免受今年美國各州已經(jīng)提出的781項與AI相關(guān)提案的影響。美國人工智能安全研究院(US AI Safety Institute)可以充當聯(lián)邦政府與私營(yíng)公司之間的主要政府機構,“企業(yè)不必受到各州法規的約束,因為后者顯然遠不及聯(lián)邦層面的監管完善”。如果企業(yè)自愿與該機構合作,允許其對自家模型進(jìn)行審查,政府就應該向它們提供“包括免除州級法規在內的責任保護”,尤其是在涉及前沿模型安全法規上。
OpenAI警告若美國不豁免AI公司州級法規束縛,否則在數據獲取受限下,美國技術(shù)優(yōu)勢將迅速消失,中國將贏(yíng)得AI競賽。政府應鼓勵公私合作,加速AI在政府機構中的應用,并消除已知的障礙,包括過(guò)時(shí)且冗長(cháng)的認證流程、限制性測試權限、缺乏靈活性的采購渠道。
想要進(jìn)行版權改革
已經(jīng)有包括OpenAI在內的多家公司,因訓練模型的數據而面臨多起版權起訴。對于此前引起巨大爭議的版權問(wèn)題,OpenAI也強調應該對此進(jìn)行版權改革 —— 這是因為「合理使用原則」(fair use doctrine)對維持AI領(lǐng)域的領(lǐng)先地位至關(guān)重要。
版權法在美國早期技術(shù)進(jìn)步的階段發(fā)揮了重要作用。美國擁有眾多AI初創(chuàng )公司,吸引大量投資,并在研究方面取得諸多突破,主要也是得益于合理使用原則。OpenAI主張強化合理使用原則,允許被允許自由使用版權材料訓練模型,同時(shí)推動(dòng)國際版權規則改革,防止中國通過(guò)“寬松監管”獲取數據優(yōu)勢。針對創(chuàng )作者群體的抗議,OpenAI反擊稱(chēng),歐盟的嚴格版權法已壓制了AI創(chuàng )新。報告同時(shí)建議美國政府向企業(yè)開(kāi)放醫療等敏感數據,以加速AI研發(fā)。
硅谷風(fēng)險投資機構Andreessen Horowitz認為,聯(lián)邦豁免權可釋放企業(yè)創(chuàng )新潛力,避免“監管碎片化”拖累競爭。而MIT技術(shù)政策教授Daron Acemoglu批評OpenAI試圖“用政治手段掩蓋技術(shù)焦慮”,其出口管制將分裂全球科技共同體。
科技霸權or科技平權
其實(shí),OpenAI早就盯上了DeepSeek。今年1月,OpenAI就曾公開(kāi)指控DeepSeek通過(guò)「模型蒸餾」(Model Distillation)技術(shù)“違規復制”其產(chǎn)品功能,然而,OpenAI卻拒絕透露具體技術(shù)細節或法律依據。模型蒸餾是一種通過(guò)訓練小型模型模仿大型模型行為的技術(shù),廣泛應用于提高AI效率與降低成本,模型蒸餾本身是公開(kāi)技術(shù),但若涉及直接復制專(zhuān)有模型的輸出結構或參數,可能構成侵權,但是模型輸出的“功能相似性”難以直接構成侵權。
除非能證明DeepSeek直接竊取了OpenAI的訓練數據或代碼架構,否則訴訟可能無(wú)果而終,若指控屬實(shí),OpenAI應公開(kāi)技術(shù)比對報告;若僅是戰略打壓,則可能損害行業(yè)創(chuàng )新生態(tài)。OpenAI與DeepSeek的爭端,折射出全球AI產(chǎn)業(yè)從技術(shù)競爭向規則競爭演變的趨勢。無(wú)論是模型蒸餾的法律定性,還是數據隱私的合規要求,都可能成為影響市場(chǎng)格局的關(guān)鍵變量。
即便美國可以封殺掉DeepSeek的手機、網(wǎng)頁(yè)端的應用,但DeepSeek的大模型、思路和代碼都已經(jīng)融入了全世界的人工智能社區,被包括美國在內的程序人員廣泛使用。Meta首席科學(xué)家楊立昆(Yann LeCun)則直指,硅谷部分人擁有一種“錯位的優(yōu)越感”。OpenAI現在應該做的是調整自己的產(chǎn)品而不是攻擊中國AI,進(jìn)行毫無(wú)依據的污蔑和無(wú)理打壓。
由于DeepSeek這次的開(kāi)源,讓行業(yè)最領(lǐng)先的水平平權了,寡頭所謂的“AI霸權”開(kāi)始動(dòng)搖,AI競賽的勝利者,不只能是擁有最多芯片的一方。這讓OpenAI重新思考,需要“弄清楚另一種開(kāi)源戰略”,也是AI普惠的開(kāi)端,會(huì )加速推動(dòng)AI進(jìn)化的速度,進(jìn)而推動(dòng)必要條件的成熟,帶來(lái)新的應用機會(huì )。
DeepSeek以較低的成本開(kāi)發(fā)出了一個(gè)性能接近美國模型水平的產(chǎn)品,這次的特殊之處在于,首先展示預期成本降低的是一家中國公司。這種情況前所未有,具有重要的地緣政治意義。需要注意的是,中國AI的崛起在基礎層仍需突破芯片、算法等瓶頸的現狀下,通過(guò)系統工程優(yōu)化實(shí)現"換道超車(chē)"不僅可能,更是必然選擇。
實(shí)際上,這是一場(chǎng)關(guān)于技術(shù)霸權爭奪、地緣政治博弈與全球AI產(chǎn)業(yè)格局重塑的縮影。在DeepSeek之前,曾經(jīng)AI技術(shù)被認為是高不可攀的“貴族科技”,只有少數巨頭才能玩得起,OpenAI、微軟、谷歌、Meta就像矗立在A(yíng)I領(lǐng)域的高山。但這一次,DeepSeek把AI從算力壟斷中解放出來(lái),重構了全球AI競爭的邏輯:從依賴(lài)資本與硬件的“軍備競賽”,轉向算法優(yōu)化與生態(tài)協(xié)作的“效率革命”。
DeepSeek-V3極低的訓練成本預示著(zhù)AI大模型對算力投入的需求將大幅下降,但由經(jīng)濟學(xué)家威廉·斯坦利·杰文斯提出的杰文斯悖論:當某種資源的使用效率提高、獲取變得更容易時(shí),其總體使用量往往不減反增。DeepSeek的發(fā)展也呈現出類(lèi)似的趨勢:算力效率的提升并未減少對算力的需求,反而推動(dòng)了更多高算力應用的落地,使得行業(yè)對算力的需求持續增長(cháng)。
報告顯示,2025年微軟、亞馬遜以及Meta等“超大規模企業(yè)”在人工智能數據中心和算力資源方面的投資將達到3710億美元,較上年增長(cháng)44%。這一數字將在2032年攀升至5250億美元,增速超過(guò)DeepSeek這一現象級產(chǎn)品爆火之前的研究預期。
此前,人工智能方面的投資主要流向用于訓練或開(kāi)發(fā)大規模新AI模型的數據中心和芯片。如今,科技巨頭將投資重點(diǎn)轉向“推理”環(huán)節,也就是模型訓練完成后運行并產(chǎn)出結果的過(guò)程。彭博行業(yè)研究分析師Mandeep Singh在報告中稱(chēng),對DeepSeek的空前關(guān)注很可能會(huì )促使科技公司“追加投資推理環(huán)節”,使其成為生成式人工智能市場(chǎng)上增長(cháng)最快的板塊。
評論