OpenAI破天荒決策!CEO親證今夏將開(kāi)放模型權重
4月1日消息,OpenAI首席執行官薩姆·奧特曼(Sam Altman)本周一透露,OpenAI將在今夏發(fā)布一款“開(kāi)放權重”的人工智能模型。
本文引用地址:http://dyxdggzs.com/article/202504/468864.htm奧特曼在社交媒體平臺X上寫(xiě)道,“我們未來(lái)幾個(gè)月內將推出一款具有推理能力的全新開(kāi)放權重語(yǔ)言模型,對此倍感振奮?!?/p>
此舉既是對中國DeepSeek R1模型迅猛成功的回應,也因應Meta的Llama系列模型日益流行的壓力。
今年1月份DeepSeek發(fā)布R1模型后不久,奧特曼曾公開(kāi)反思,OpenAI在開(kāi)放模型的問(wèn)題上“站在歷史錯誤的一邊”,暗示戰略調整勢在必行。本周一,他表示公司醞釀開(kāi)放權重模型已有時(shí)日,“現在已到了必須行動(dòng)的時(shí)刻”。
鑒于DeepSeek宣稱(chēng)其模型訓練成本僅為主流大模型的零頭,OpenAI或許需要證明其新模型的低成本訓練能力。
HuggingFace主營(yíng)業(yè)務(wù)是托管開(kāi)放模型。公司聯(lián)合創(chuàng )始人兼首席執行官克萊門(mén)特·德朗格(Clement Delangue)稱(chēng),“這無(wú)疑是振奮人心的消息。隨著(zhù)DeepSeek的出現,整個(gè)行業(yè)正在認識到開(kāi)放權重的力量”
當前,OpenAI主要通過(guò)聊天機器人和云端服務(wù)提供其人工智能技術(shù)。而R1、Llama等開(kāi)源權重模型不僅可以免費下載,還允許進(jìn)行修改。所謂模型權重,指的是大型神經(jīng)網(wǎng)絡(luò )內部的參數值——這些參數在模型訓練過(guò)程中確定。相較于閉源模型,開(kāi)源權重模型使用成本更低,且能夠針對敏感場(chǎng)景進(jìn)行定制,例如處理需要高度保密的信息。
OpenAI技術(shù)團隊成員史蒂文·海德?tīng)枺⊿teven Heidel)在轉發(fā)奧特曼的公告時(shí)補充說(shuō),“我們今年將發(fā)布一款可在自有硬件上運行的新模型?!?/p>
OpenAI負責人工智能安全研究的研究員約翰內斯·海德克(Johannes Heidecke)也通過(guò)社交媒體平臺X強調,公司將實(shí)施嚴格測試,確保開(kāi)放權重模型不被濫用。一些人工智能研究人員擔心,開(kāi)放權重模型可能助長(cháng)網(wǎng)絡(luò )攻擊乃至生化武器研發(fā)的可能。對此海德克明確表示,“雖然開(kāi)放模式帶來(lái)了獨特挑戰,但會(huì )遵循我們的預備框架,確保開(kāi)放權重模型不易被濫用?!?/p>
周一OpenAI還在官網(wǎng)發(fā)布信息,邀請開(kāi)發(fā)者申請內測即將發(fā)布的新模型。奧特曼透露,未來(lái)幾周公司將舉辦多場(chǎng)活動(dòng),向開(kāi)發(fā)者展示新模型原型。
作為人工智能領(lǐng)域首個(gè)推行開(kāi)放策略的頭部企業(yè),Meta于2023年7月發(fā)布Llama初代模型,此后開(kāi)放權重模型(參數可公開(kāi))數量激增。然而研究人員指出,Llama等模型的透明度仍存爭議:其訓練數據與核心技術(shù)細節始終未公開(kāi)。此外,Meta的許可協(xié)議明確限制第三方通過(guò)Llama衍生工具獲利,形成“技術(shù)開(kāi)源、商業(yè)設限”的獨特模式。
評論