開(kāi)源模型主導AI未來(lái)
DeepSeek開(kāi)源大模型迅速成為行業(yè)焦點(diǎn)。OpenAI創(chuàng )始人山姆·奧特曼(Sam Altman)也罕見(jiàn)承認其“閉源路線(xiàn)站在了歷史錯誤的一邊”,并于近期宣布在接下來(lái)的幾個(gè)月里將發(fā)布自GPT-2以來(lái)的第一個(gè)開(kāi)源模型;國內原本走閉源路線(xiàn)的互聯(lián)網(wǎng)企業(yè)也轉向開(kāi)源生態(tài)。
一系列事件標志著(zhù)開(kāi)源AI路線(xiàn)取得階段性勝利,開(kāi)源的成本、透明度與靈活性等優(yōu)勢,正在重塑大模型競爭格局。
作為全球范圍內開(kāi)源路線(xiàn)的代表之一,紅帽“以開(kāi)源推動(dòng)效率革命”的理念其實(shí)更早,當下,DeepSeek的爆火,加強了公眾對于開(kāi)源路線(xiàn)的認知。
近日,紅帽全球副總裁兼大中華區總裁曹衡康在接受21世紀經(jīng)濟報道記者采訪(fǎng)時(shí)表示,紅帽將DeepSeek視為“生態(tài)伙伴”:“他們的模型可以無(wú)縫運行在紅帽平臺上?!边@種互補合作催生了新的商業(yè)模式——企業(yè)可在紅帽的OpenShift AI平臺上同時(shí)部署DeepSeek、Llama等開(kāi)源模型,根據業(yè)務(wù)需求動(dòng)態(tài)分配算力。
盡管AI非?;馃?,但很多企業(yè)依然處于探索和測試階段。
紅帽數據顯示,94%的企業(yè)正在進(jìn)行生成式AI試點(diǎn),預計未來(lái)3到5年才能真正實(shí)現AI投資的回報?!癆I部署的挑戰不只是技術(shù)本身,更重要的是如何把AI應用到實(shí)際生產(chǎn)環(huán)境中,尤其是在企業(yè)的核心應用上?!辈芎饪嫡f(shuō)。
曹衡康透露,在紅帽看來(lái),企業(yè)級AI應用更恰當的路徑是開(kāi)源、混合式和專(zhuān)有小模型。
截至目前,開(kāi)源的價(jià)值更明顯。原因在于,現階段的AI仍然需要大量嘗試,如果一千個(gè)人在一千個(gè)方向上探索,速度就會(huì )比一家公司單獨摸索要快得多。
在傳統軟件開(kāi)發(fā)中,需求和實(shí)現路徑往往較為明確,用閉源也沒(méi)什么不妥;可是在A(yíng)I領(lǐng)域里還有很多未知,開(kāi)源能夠極大加快創(chuàng )新進(jìn)程。閉源意味著(zhù)只有少數人能?chē)L試,效率相對低很多。通過(guò)開(kāi)源,全球的開(kāi)發(fā)者可以共同參與到AI的創(chuàng )新與改進(jìn)中。
“混合式AI”意味著(zhù)AI不會(huì )局限于云端,企業(yè)內部的計算資源同樣可以用于A(yíng)I模型的開(kāi)發(fā)和應用。
閉源模型通常綁定特定云服務(wù)商,導致企業(yè)存在“被技術(shù)綁架”的風(fēng)險?;旌显撇呗栽试SAI模型在本地數據中心、公有云或邊緣設備間自由遷移。
此外,不同于通用AI,行業(yè)專(zhuān)用的生成式AI模型要求根據具體業(yè)務(wù)需求定制。曹衡康舉例說(shuō),醫療行業(yè)、汽車(chē)行業(yè)和零售行業(yè)都需要專(zhuān)門(mén)針對各自行業(yè)特點(diǎn)的AI模型,而不是通用的大模型。
通用大模型并不總是最適合企業(yè)資源。企業(yè)需要的不是“萬(wàn)能模型”,而是貼合業(yè)務(wù)的專(zhuān)有模型。
“我們相信,AI的應用應當能夠跨越不同平臺,從企業(yè)的數據中心到邊緣計算,甚至個(gè)人設備,都能靈活部署和運用?!辈芎饪当硎?,開(kāi)源、混合式和小模型原則,可以幫助企業(yè)以更低的成本開(kāi)發(fā)高效的AI模型,減少對GPU等高性能硬件的依賴(lài),并降低運營(yíng)成本。
曹衡康也提到了企業(yè)AI部署的三個(gè)挑戰:成本、復雜度和靈活性。
閉源大模型的訓練和部署需要天量算力,企業(yè)往往因硬件投入和云服務(wù)費用不堪重負。曹衡康指出,“小模型”策略通過(guò)模型蒸餾(Distillation)和私有數據調優(yōu),可將參數規??s減至原模型的千分之一,硬件成本明顯降低。并且,通用大模型為追求廣泛適用性,往往保留冗余功能,導致輸出不可控,“專(zhuān)有小模型”策略則聚焦垂直場(chǎng)景,調用算力更少,效率更高。
多數企業(yè)缺乏AI專(zhuān)業(yè)人才,難以駕馭復雜的模型開(kāi)發(fā)和數據清洗流程。紅帽通過(guò)RHEL AI、OpenShift AI等一體化平臺,將模型訓練、調優(yōu)和部署集成到標準化工具中。例如,InstructLab允許企業(yè)用私有數據生成合成訓練集,將數據需求量降至原來(lái)的千分之一,同時(shí)支持自動(dòng)化模型“瘦身”。
最后,靈活性至關(guān)重要,企業(yè)需要能夠根據自身需求,在不同平臺、不同硬件上靈活部署AI模型。
大模型的“幻覺(jué)問(wèn)題”也是閉源路線(xiàn)的硬傷。由于模型參數和訓練數據不透明,企業(yè)難以追溯錯誤根源。而開(kāi)源AI通過(guò)透明化調優(yōu)與社區監督,可以有效降低模型幻覺(jué)率。開(kāi)源模型的代碼、參數和訓練數據完全公開(kāi),企業(yè)可根據自身需求調整模型邏輯。
開(kāi)源AI的勝利并非偶然,而是AI規?;涞氐膬?yōu)勢路徑。在這場(chǎng)變革中,那些以開(kāi)放生態(tài)賦能企業(yè)的平臺,不追求壟斷模型,而是構建自由、透明、經(jīng)濟的AI未來(lái)。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。