紅帽CTO Chris Wright:關(guān)于開(kāi)源AI,紅帽的觀(guān)點(diǎn)在這里
三十多年前,紅帽便洞察到開(kāi)源開(kāi)發(fā)和許可證能夠推動(dòng)更優(yōu)質(zhì)軟件的誕生,從而加速I(mǎi)T創(chuàng )新。經(jīng)過(guò)三千萬(wàn)行代碼的積淀,Linux不僅成為了最成功的開(kāi)源軟件,也成長(cháng)為至今最成功的軟件之一。我們對開(kāi)源原則的承諾延續至今,既體現在我們的商業(yè)模式中,也深深扎根于我們的企業(yè)文化中。我們堅信,若采用正確的方法,這些理念同樣能夠在人工智能(AI)領(lǐng)域產(chǎn)生深遠的影響。然而,技術(shù)界對于“正確的方法”究竟是什么,依然存在廣泛的爭議。
本文引用地址:http://dyxdggzs.com/article/202502/467012.htmAI,特別是推動(dòng)生成式AI(Gen AI)發(fā)展的大型語(yǔ)言模型(LLM),不能簡(jiǎn)單地與開(kāi)源軟件類(lèi)比。與軟件不同,AI模型主要由模型權重構成,這些權重是決定模型如何處理輸入以及它如何在各個(gè)數據點(diǎn)之間建立聯(lián)系的數值參數。訓練后的模型權重是通過(guò)廣泛的訓練過(guò)程生成的,這一過(guò)程涉及大量精心準備、混合和處理的訓練數據。
盡管模型權重與軟件不同,但在某些方面,它們履行的職能類(lèi)似于代碼。我們可以將數據類(lèi)比為模型的源代碼。在開(kāi)源領(lǐng)域,源代碼通常被定義為修改軟件的“首選形式”。然而,單靠訓練數據無(wú)法承擔這一角色,因為訓練數據通常體積龐大,且復雜的預訓練過(guò)程使得每一項訓練數據與訓練后權重及模型最終行為之間的聯(lián)系顯得間接且微弱。
目前,許多AI模型的改進(jìn)和增強并不涉及訪(fǎng)問(wèn)或修改原始訓練數據。相反,它們通常通過(guò)修改或微調模型權重來(lái)實(shí)現,這些過(guò)程也可用于優(yōu)化模型性能。要確保這些模型改進(jìn)能自由進(jìn)行,模型權重必須以開(kāi)源許可證發(fā)布,并且用戶(hù)應在開(kāi)源許可證下享有全部權限。
紅帽認為,開(kāi)源AI的最低標準是將開(kāi)源許可證下的模型權重與開(kāi)源軟件組件相結合。這是開(kāi)源AI的起點(diǎn),而非最終目標。我們鼓勵開(kāi)源社區、監管機構和行業(yè)在訓練和微調AI模型時(shí),繼續朝著(zhù)更大的透明度和與開(kāi)源開(kāi)發(fā)原則對齊的方向努力。
這是紅帽作為開(kāi)源軟件生態(tài)系統成員,如何在實(shí)踐中參與開(kāi)源AI的觀(guān)點(diǎn)。與開(kāi)源倡議組織(OSI)提出的《開(kāi)源AI定義》(OSAID)不同,我們的看法并非正式定義。到目前為止,我們的觀(guān)點(diǎn)主要是關(guān)于如何實(shí)現開(kāi)源AI,并確保它對廣泛的社區、企業(yè)和供應商都能實(shí)現可訪(fǎng)問(wèn)性。
我們通過(guò)在開(kāi)源社區中的工作將這一觀(guān)點(diǎn)付諸實(shí)踐,其中包括由紅帽主導的InstructLab項目,以及我們與IBM研究院合作的Granite開(kāi)源許可證模型系列。InstructLab大大降低了非數據科學(xué)家對AI模型的貢獻門(mén)檻。通過(guò)InstructLab,各行各業(yè)的領(lǐng)域專(zhuān)家可以將他們的技能和知識貢獻到InstructLab,這些貢獻不僅用于內部使用,還能推動(dòng)一個(gè)共享的、廣泛可訪(fǎng)問(wèn)的開(kāi)源AI模型供上游社區使用。
Granite 3.0模型系列覆蓋了從代碼生成、自然語(yǔ)言處理到從龐大數據集中提取洞察的廣泛AI應用場(chǎng)景,所有這些都在一個(gè)寬松的開(kāi)源許可證下進(jìn)行。我們幫助IBM研究院將Granite代碼模型系列引入開(kāi)源世界,并繼續從開(kāi)源視角以及作為我們紅帽AI產(chǎn)品的一部分支持這個(gè)模型系列。
近期DeepSeek的宣布引起廣泛關(guān)注,它展示了開(kāi)源創(chuàng )新對AI的影響,不僅局限于模型層面,還延伸到了更廣的領(lǐng)域。而針對DeepSeek的做法,外界存在一定疑慮,特別是其模型的許可證未能明確說(shuō)明模型的生產(chǎn)過(guò)程,這進(jìn)一步突顯了透明度的重要性。盡管如此,這一顛覆性創(chuàng )新也驗證了我們對AI未來(lái)的看法:一個(gè)開(kāi)放的AI生態(tài),聚焦于更小巧、優(yōu)化且開(kāi)放的模型,這些模型能夠根據特定企業(yè)的數據和使用場(chǎng)景,在全球范圍內、跨越混合云環(huán)境進(jìn)行定制。
擴展開(kāi)源AI,超越模型
開(kāi)源技術(shù)和開(kāi)發(fā)原則始終是我們AI產(chǎn)品的核心,正如它們在紅帽AI產(chǎn)品組合中所起的作用一樣。紅帽OpenShift AI基于Kubernetes、KubeFlow以及符合Open Container Initiative(OCI)標準的容器,融合了眾多云原生開(kāi)源技術(shù)。而紅帽企業(yè)Linux AI(RHEL AI)則整合了來(lái)自IBM的開(kāi)源許可證Granite LLM系列和InstructLab開(kāi)源項目。
紅帽在開(kāi)源AI領(lǐng)域的工作不僅限于InstructLab和Granite模型系列,它還涵蓋了實(shí)現和有效利用AI所需的各種工具和平臺。我們積極參與并推動(dòng)越來(lái)越多的上游項目和社區,同時(shí)自主發(fā)起了多個(gè)項目,包括(但不限于):
● RamaLama:簡(jiǎn)化本地管理和服務(wù)AI模型的開(kāi)源項目;
● TrustyAI:為構建更負責任的AI工作流提供的開(kāi)源工具包;
● Climatik:幫助減少AI在能源消耗方面負面影響的項目,推動(dòng)AI的可持續發(fā)展;
● Podman AI Lab:專(zhuān)注于為開(kāi)源LLM模型提供實(shí)驗支持的開(kāi)發(fā)者工具包;
● Neural Magic:收購這家公司進(jìn)一步推動(dòng)了我們的AI愿景,使企業(yè)能夠將更小、更優(yōu)化的AI模型(包括開(kāi)源許可證模型)與其數據進(jìn)行對接,無(wú)論數據存儲在哪里,都能跨越混合云環(huán)境進(jìn)行無(wú)縫連接。IT組織可以借助vLLM推理服務(wù)器來(lái)支持這些模型的決策和輸出,從而構建一個(gè)以透明性和支持技術(shù)為基礎的AI堆棧。
對紅帽而言,開(kāi)源AI在混合云中得到了真正的生命?;旌显茷槊總€(gè)AI工作負載選擇最合適的環(huán)境提供了靈活性,從而能夠優(yōu)化性能、成本、可擴展性和安全性需求。我們的平臺、目標和企業(yè)都支持這一努力,我們期待與行業(yè)伙伴、客戶(hù)以及更廣泛的開(kāi)源社區攜手合作,持續推動(dòng)開(kāi)源AI創(chuàng )新。
在A(yíng)I領(lǐng)域,拓展開(kāi)放合作的潛力巨大。我們展望的未來(lái)不僅關(guān)注模型的透明度,還包括訓練過(guò)程的開(kāi)放。無(wú)論是下周、下個(gè)月,還是更快(AI發(fā)展迅速),我們將繼續支持并推動(dòng)AI的自主化與開(kāi)放性,突破開(kāi)源AI的邊界。
關(guān)于作者
Chris Wright
紅帽首席技術(shù)官兼全球工程高級副總裁
Chris Wright負責領(lǐng)導首席技術(shù)官辦公室,該辦公室負責孵化新興技術(shù),并對人工智能、云計算、分布式存儲、軟件定義網(wǎng)絡(luò )和網(wǎng)絡(luò )功能虛擬化、容器、自動(dòng)化和持續交付以及分布式賬本等創(chuàng )新提出前瞻性觀(guān)點(diǎn)。在20多年的軟件工程師生涯中,Wright曾在電信行業(yè)從事高可用性和分布式系統方面的工作,在Linux行業(yè)從事安全、虛擬化和網(wǎng)絡(luò )方面的工作。他從事Linux開(kāi)發(fā)超過(guò)15年,其中大部分時(shí)間都在深入研究Linux內核。他對將開(kāi)源軟件作為下一代IT系統的基礎充滿(mǎn)熱忱。
評論