開(kāi)源之爭:馬斯克起訴OpenAI后宣布開(kāi)源Grok
馬斯克宣布將在本周開(kāi)源xAI的聊天機器人Grok,并且再度炮轟OpenAI是個(gè)謊言(OpenAI is a lie)。他曾在去年吐槽稱(chēng),OpenAI中的“Open”本意是開(kāi)放源代碼,它是作為非營(yíng)利性開(kāi)放源代碼創(chuàng )建的,而現在它卻成了一個(gè)追求最大利潤的封閉源代碼。
本文引用地址:http://dyxdggzs.com/article/202403/456249.htm早在去年11月,馬斯克在參與一場(chǎng)播客時(shí)就公開(kāi)表示,OpenAI的“閉源”行為不可取,xAI的Grok將采取開(kāi)源路線(xiàn)。
馬斯克旗下的AI
2023年7月,馬斯克成立了人工智能公司xAI。同年11月,xAI團隊正式發(fā)布其首個(gè)AI大模型產(chǎn)品Grok。目前的Grok跟此前OpenAI發(fā)布的GPT-3.5形式差不多,但是測試結果顯示,它在數學(xué)、代碼和多學(xué)科知識評測中比GPT-3.5表現得更好。
Grok背靠馬斯克旗下的老牌社交媒體平臺X(前身為T(mén)witter),使用了X上的大量數據進(jìn)行訓練,且可以實(shí)時(shí)訪(fǎng)問(wèn)X平臺的所有信息。馬斯克曾表示這是收購推特的附加福利,可以用來(lái)“喂養”人工智能,接受現實(shí)中人類(lèi)發(fā)言和對話(huà)信息的訓練。另外,他還有來(lái)自特斯拉的導航和視頻數據,可能將使其團隊開(kāi)發(fā)的聊天機器人不限于文本生成。
目前并不清楚Grok背后哪些模型會(huì )開(kāi)源,但通常來(lái)說(shuō),發(fā)布開(kāi)源模型有助于社區展開(kāi)大規模的測試和反饋,意味著(zhù)模型本身的迭代速度也能加快。
當然,馬斯克將xAI的大模型開(kāi)源,本身也有可能一種運營(yíng)手段。假設馬斯克“說(shuō)到做到”,外界將得以見(jiàn)到Grok背后的代碼,同時(shí)將其與Meta的Llama 2、法國的Mistral等開(kāi)源賽道的主要玩家相互比較。
開(kāi)源之爭
今年2月29日,馬斯克在舊金山法院起訴了OpenAI及其首席執行官山姆·奧特曼,提出了包括違反合同、違反信托義務(wù)和不公平商業(yè)行為在內的索賠。馬斯克稱(chēng),OpenAI選擇了不公開(kāi)其研究和技術(shù),實(shí)際上已成為受微軟控制的閉源子公司,違背了其成立時(shí)的初衷,即為人類(lèi)福祉而非利益開(kāi)發(fā)人工智能。
除了一系列違約指控外,馬斯克還特意要求法院裁定OpenAI恢復開(kāi)源;OpenAI方面也拿出證據稱(chēng),馬斯克在郵件中曾認可OpenAI的不開(kāi)源決定。
2023年3月,OpenAI發(fā)布了AI語(yǔ)言模型GPT-4,并分享了GPT-4的大量測試結果以及一些有趣的演示,但基本上沒(méi)有提供有關(guān)用于訓練系統的數據、用于創(chuàng )建該系統的特定硬件或方法的信息。當時(shí),馬斯克就開(kāi)源問(wèn)題稱(chēng)OpenAI是作為開(kāi)源的非營(yíng)利性公司創(chuàng )立,目的是與谷歌抗衡,而現在卻成為封閉源代碼的公司 —— “如今落入了無(wú)情的壟斷企業(yè)之手”。對此,奧特曼表示自己沒(méi)有從這家初創(chuàng )公司大舉獲利,他理解馬斯克的批評是真實(shí)的擔憂(yōu),但是認為他還沒(méi)有完全認識到人工智能安全問(wèn)題的復雜性。
全球科技巨頭在生成式人工智能的發(fā)展中已經(jīng)分化為開(kāi)源和閉源兩種。
· 開(kāi)源模型即開(kāi)放源代碼,將模型的源代碼和技術(shù)細節公開(kāi),允許用戶(hù)根據自身需要對模型進(jìn)行使用和修改,目前,Meta的LLaMA、StabilityAI的Stable Diffusion、國內阿里的通義千問(wèn)都屬于開(kāi)源模型。
· 閉源模型則與之相反,不開(kāi)放源代碼和技術(shù)細節,且不允許用戶(hù)對模型本身進(jìn)行更改。目前,OpenAI的ChatGPT、谷歌的Gemini、國內的百度文心一言都屬于閉源模型。
總體而言,閉源模式更有利益保護知識產(chǎn)權和商業(yè)利益,讓模型提供方對模型的研發(fā)和優(yōu)化擁有更多的控制權,確保模型的質(zhì)量和安全;而開(kāi)源模式則讓技術(shù)得以共享,繁榮了開(kāi)發(fā)者生態(tài),能夠吸引眾多人才加入,推動(dòng)大模型加速迭代和創(chuàng )新。
不過(guò)也有研究顯示,相較于開(kāi)源來(lái)說(shuō),閉源模型相對更成熟、數據質(zhì)量更有保障。業(yè)內的一個(gè)普遍共識是,目前閉源大模型的能力和性能總體領(lǐng)先于開(kāi)源大模型。
評論