<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 新版DeepSeek V3悄然發(fā)布 外媒:很強但少了"人味"

新版DeepSeek V3悄然發(fā)布 外媒:很強但少了"人味"

作者: 時(shí)間:2025-03-26 來(lái)源:網(wǎng)易科技 收藏

3月25日消息,中國初創(chuàng )公司DeepSeek悄然發(fā)布了一款新的大語(yǔ)言模型,在行業(yè)引發(fā)震動(dòng)。這不僅因為其強大的能力,還因為其獨特的發(fā)布方式。

本文引用地址:http://dyxdggzs.com/article/202503/468620.htm

這個(gè)大小為641GB的模型名為DeepSeek-V3-0324,于周一悄然出現在資源庫上,幾乎沒(méi)有任何官方公告,延續了該公司低調卻影響深遠的發(fā)布風(fēng)格。

此次發(fā)布尤其值得關(guān)注的是,該模型采用MIT許可(允許免費商用),并且有報道稱(chēng)它可以直接在消費者級“硬件”上運行,尤其是配備芯片的蘋(píng)果Mac Studio。

人工智能研究員Awni Hannun在社交媒體上寫(xiě)道:“4比特量化的DeepSeek-V3-0324,在512GB M3 Ultra的機器上通過(guò)mlx-lm實(shí)現了每秒20個(gè)token的處理速度!”雖然售價(jià)為9499美元的Mac Studio可能超出了“消費者硬件”的定義,但能夠在這樣的硬件上本地運行如此龐大的模型,標志著(zhù)與通常與最先進(jìn)人工智能技術(shù)相關(guān)的數據中心需求有了根本性突破。

DeepSeek隱秘發(fā)布策略打破市場(chǎng)預期

這個(gè)擁有6850億參數的模型發(fā)布時(shí)沒(méi)有附帶技術(shù)白皮書(shū)、博客文章或營(yíng)銷(xiāo)推廣,只有一個(gè)空白的README文件和模型權重。這種做法與西方人工智能公司通常精心策劃的產(chǎn)品發(fā)布形成鮮明對比,后者往往在發(fā)布前數月便開(kāi)始進(jìn)行炒作。

早期測試者報告稱(chēng),相比于前一版本,DeepSeek-V3-0324在各項指標上有了顯著(zhù)提升。人工智能研究員Xeophon在社交媒體上發(fā)帖高調宣稱(chēng):“我在內部基準測試平臺上測試了DeepSeek V3,在所有測試中,它在各項指標上都有巨大的躍升。它現在是最好的非推理模型,把Sonnet 3.5拉下王座?!?/p>

如果這一說(shuō)法得到更廣泛的驗證,DeepSeek的新模型將在性能排行榜上壓制Anthropic的Claude Sonnet 3.5,后者是業(yè)內公認頂尖的商業(yè)人工智能系統之一。而且與需要訂閱的Sonnet不同,DeepSeek-V3-0324的權重文件供任何人免費下載使用。

-0324的突破性架構如何實(shí)現無(wú)與倫比的效率

DeepSeek-V3-0324采用了混合專(zhuān)家(MoE)架構,從根本上重新構想了大語(yǔ)言模型的運作方式。傳統模型會(huì )在每項任務(wù)中激活全部參數,而DeepSeek的方法是在特定任務(wù)中只激活約370億個(gè)參數,盡管它擁有6850億個(gè)參數。

這種選擇性激活代表了模型效率的范式轉變。通過(guò)僅激活與每個(gè)特定任務(wù)最相關(guān)的“專(zhuān)家”參數,DeepSeek能夠在大幅減少計算需求的同時(shí),提供與更大、完全激活的模型相當的性能。

該模型還融入了兩項突破性技術(shù):多頭潛在注意力(MLA)和多token預測(MTP)。MLA增強了模型在處理長(cháng)文本時(shí)保持上下文的能力,而MTP則可以每個(gè)步驟生成多個(gè)token,而非傳統的逐標記生成方式。兩者結合使得輸出速度提高了近80%。

開(kāi)發(fā)工具創(chuàng )造者西蒙·威利森(Simon Willison)在博客中指出,4比特量化版本的DeepSeek-V3將存儲占用減少到352GB,這使得在像Mac Studio(配備芯片)這樣的高端消費者硬件上運行成為可能。

這代表了人工智能技術(shù)部署方式的潛在重大轉變。傳統人工智能基礎設施通常依賴(lài)于多塊英偉達GPU,消耗數千瓦的電力,而Mac Studio在推理過(guò)程中僅消耗不到200瓦的電力。這一效率差距表明,人工智能行業(yè)可能需要重新審視關(guān)于頂尖模型性能所需基礎設施的假設。

中國的開(kāi)源革命挑戰硅谷的“封閉花園”模式

DeepSeek的發(fā)布策略體現了中西方公司在人工智能商業(yè)理念上的根本分歧。像Open和Anthropic這樣的美國領(lǐng)軍公司將他們的模型封閉在付費墻后,而中國人工智能公司則越來(lái)越多地采納寬松的開(kāi)源許可。

這種做法正在迅速改變中國的人工智能生態(tài)系統。尖端模型的開(kāi)源產(chǎn)生了乘數效應,使得初創(chuàng )公司、研究人員和開(kāi)發(fā)人員能夠在沒(méi)有巨額資本支出的情況下,基于復雜的人工智能技術(shù)進(jìn)行構建。這加速了中國人工智能能力的提升,令西方觀(guān)察者感到震驚。

這一策略背后的商業(yè)邏輯反映了中國市場(chǎng)的現實(shí)。在眾多資金雄厚的競爭對手存在的情況下,當競爭者免費提供類(lèi)似能力時(shí),保持專(zhuān)有模型變得越來(lái)越困難。開(kāi)源通過(guò)生態(tài)系統領(lǐng)導地位、API服務(wù)和基于免費可用基礎模型構建的企業(yè)解決方案創(chuàng )造了替代的價(jià)值路徑。

即便是中國的科技巨頭也認識到這一轉變。百度宣布計劃在6月前將其文心一言4.5系列模型開(kāi)源,而阿里巴巴和騰訊也發(fā)布了具有專(zhuān)業(yè)能力的開(kāi)源人工智能模型。這一舉措與西方公司依賴(lài)API的策略形成了鮮明對比。

開(kāi)源策略還解決了中國人工智能公司面臨的獨特挑戰。在獲取尖端英偉達芯片受限的情況下,中國公司更加強調效率和優(yōu)化,以在有限的計算資源下實(shí)現競爭性性能。這種由需求驅動(dòng)的創(chuàng )新現在已成為潛在的競爭優(yōu)勢。

-0324:AI推理革新的基礎

DeepSeek-V3-0324的發(fā)布時(shí)機和特點(diǎn)強烈表明,DeepSeek預計將在未來(lái)兩個(gè)月內發(fā)布的改進(jìn)型推理專(zhuān)用模型DeepSeek-R2。這符合DeepSeek的慣常模式,即基礎模型發(fā)布數周后推出專(zhuān)用推理模型。

Reddit用戶(hù)mxforest指出:“這與他們在圣誕節前后發(fā)布V3,幾周后推出R1的模式一致。傳聞R2將在4月發(fā)布,所以這可能就是它?!?/p>

推理模型的開(kāi)源再怎么強調都不為過(guò)。目前,像OpenAI的o1和DeepSeek的R1這樣的推理模型代表了人工智能能力的最前沿,在數學(xué)、編程等領(lǐng)域展現了前所未有的問(wèn)題解決能力。將這項技術(shù)免費開(kāi)放,會(huì )使目前只有擁有雄厚資金支持的公司才能使用的人工智能系統普及化。

潛在的R2模型發(fā)布之際,關(guān)于推理模型計算需求的重要發(fā)現正在浮現。英偉達首席執行官黃仁勛最近指出,DeepSeek的R1模型“消耗的計算量是非推理人工智能系統的100倍”,這與之前業(yè)內對效率的假設相矛盾。這揭示了DeepSeek模型背后取得的非凡成就,它們在資源限制更大的情況下依然能夠提供競爭力的表現。

如果DeepSeek-R2繼續沿著(zhù)R1設定的軌跡發(fā)展,它可能會(huì )直接挑戰GPT-5,即OpenAI的下一代旗艦模型,后者預計將在不久后發(fā)布。OpenAI封閉、資金密集型的方法與DeepSeek開(kāi)放、資源高效的戰略之間,代表了人工智能領(lǐng)域兩種相互競爭的未來(lái)愿景。

如何體驗-0324:開(kāi)發(fā)者和用戶(hù)的完整指南

對于那些急于體驗DeepSeek-V3-0324的人,根據技術(shù)需求和資源的不同,可以選擇多種途徑。完整的模型權重已在上發(fā)布,641GB的大小需要充足的存儲空間和計算資源。

對于大多數用戶(hù)而言,基于云的選項提供了最易接入的入口。OpenRouter提供免費API訪(fǎng)問(wèn)該模型,并且配有用戶(hù)友好的聊天界面。只需選擇DeepSeek V3 0324作為模型即可開(kāi)始體驗。

DeepSeek自己的聊天界面chat.deepseek.com也很可能已經(jīng)更新為本,盡管公司尚未明確確認。早期用戶(hù)反饋稱(chēng),新的版本在該平臺上可用,且性能較此前版本有所提升。

希望將模型集成到應用程序中的開(kāi)發(fā)者,也可以通過(guò)各種推理提供商訪(fǎng)問(wèn)它。Hyperbolic Labs宣布成為“在平臺上首家提供該模型服務(wù)的推理提供商”提供該模型,而OpenRouter則提供與OpenAI SDK兼容的API訪(fǎng)問(wèn)。

DeepSeek的新模型更注重技術(shù)精確性而非對話(huà)親和力

早期用戶(hù)報告稱(chēng),DeepSeek模型的交流風(fēng)格發(fā)生了明顯變化。盡管之前的模型因其對話(huà)式、擬人化的語(yǔ)氣備受好評,但DeepSeek V3-0324呈現出更加正式、技術(shù)導向的風(fēng)格。

Reddit用戶(hù)nother_level問(wèn)道:“是只有我覺(jué)得這個(gè)版本不那么像人類(lèi)了嗎?對我來(lái)說(shuō),DeepSeek V3與其他模型不同的地方在于它更像人類(lèi)。它的語(yǔ)氣、措辭都不像其他大語(yǔ)言模型那樣機械感,但現在這個(gè)版本感覺(jué)像其他大語(yǔ)言模型一樣機械得要命?!?/p>

另一位用戶(hù)AppearanceHeavy6724補充道:“沒(méi)錯,它肯定失去了那種超然的魅力,感覺(jué)聰明反被聰明誤?!?/p>

這種明顯的風(fēng)格變化似乎是DeepSeek工程師的有意設計。轉向更精準、分析式的交流風(fēng)格,表明該公司正將模型重新定位至專(zhuān)業(yè)和技術(shù)應用,而非休閑對話(huà)的戰略。這與人工智能行業(yè)的廣泛趨勢一致,開(kāi)發(fā)者越來(lái)越認識到,不同的使用場(chǎng)景需要不同的互動(dòng)風(fēng)格。

對開(kāi)發(fā)專(zhuān)業(yè)應用的開(kāi)發(fā)者而言,這種更精準的交流風(fēng)格反而成為優(yōu)勢,能為工作流程提供更清晰一致的輸出;但會(huì )削弱模型在需親和力的消費端應用中的吸引力。

DeepSeek的開(kāi)源戰略如何重塑全球AI版圖

DeepSeek的人工智能技術(shù)開(kāi)發(fā)和分發(fā)方法不僅是一項技術(shù)成就,也體現了關(guān)于先進(jìn)技術(shù)應如何在社會(huì )中傳播的根本不同愿景。通過(guò)提供開(kāi)放許可的尖端人工智能模型,DeepSeek推動(dòng)了一個(gè)傳統閉源模型無(wú)法比擬的指數級創(chuàng )新。這一戰略正在快速縮小中國和美國在人工智能領(lǐng)域的差距。幾個(gè)月前,大多數分析師都認為中國落后美國一到兩年,而如今這一差距已縮小至3至6個(gè)月,部分領(lǐng)域接近持平甚至中國領(lǐng)先。

這種開(kāi)源部署理念與安卓對移動(dòng)生態(tài)系統的影響頗為相似。通過(guò)免費提供安卓系統,谷歌創(chuàng )建了一個(gè)平臺,最終實(shí)現了全球市場(chǎng)的主導地位。同樣,開(kāi)源人工智能模型也有可能憑借廣泛普及和開(kāi)發(fā)者集體創(chuàng )新,在競爭中超越閉源系統。

這一影響超越了市場(chǎng)競爭,直指技術(shù)獲取的根本問(wèn)題。西方AI巨頭因將先進(jìn)能力集中在資源充足的公司與個(gè)人手中而備受批評,而DeepSeek的開(kāi)放戰略讓能力廣泛分布,可能加速全球AI應用。

隨著(zhù)DeepSeek-V3-0324進(jìn)入全球研究實(shí)驗室和開(kāi)發(fā)者工作站,競爭已不再僅僅是關(guān)于構建最強大的人工智能,而是關(guān)于讓更多人能夠利用人工智能進(jìn)行創(chuàng )造。在這場(chǎng)競賽中,DeepSeek的低調發(fā)布已充分預示了人工智能的未來(lái)。最自由分享技術(shù)的公司,或將最終主導AI重塑世界的進(jìn)程。



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>