馬斯克打臉OpenAI,全球最大巨無(wú)霸模型Grok-1開(kāi)源!3140億參數8個(gè)MoE,GitHub狂攬6k星
說(shuō)到做到,馬斯克xAI的Grok,果然如期開(kāi)源了!
就在剛剛,xAI正式發(fā)布3140億參數混合專(zhuān)家模型Grok-1的權重和架構。

3140億的參數,讓Grok-1成為迄今參數量最大的開(kāi)源LLM,是Llama 2的4倍。
目前,xAI關(guān)于Grok-1沒(méi)有透露更多信息。
官網(wǎng)放出的信息如下——
- 基礎模型在大量文本數據上訓練,未針對任何特定任務(wù)進(jìn)行微調。
- 314B參數的MoE,有25%的權重在給定token上處于激活狀態(tài)。
- 2023年10月,xAI使用JAX和Rust之上的自定義訓練堆棧從頭開(kāi)始訓練。
一經(jīng)上線(xiàn)GitHub,Grok就狂攬了6k星,586個(gè)Fork。
項目地址:https://github.com/xai-org/grok-1
馬斯克還不忘嘲諷OpenAI一番,「告訴我們更多關(guān)于OpenAI的「open」部分...」
紐約時(shí)報點(diǎn)評道,開(kāi)源Gork背后的原始代碼,是這個(gè)世界上最富有的人控制AI未來(lái)戰斗的升級。
開(kāi)源究竟會(huì )讓技術(shù)更安全,還是會(huì )讓它更濫用?
「開(kāi)源支持者」馬斯克,以身作則地卷入了AI界的這場(chǎng)激烈辯論,并用行動(dòng)給出了答案。
小扎剛剛也對Grok做出了評價(jià),「并沒(méi)有給人留下真正深刻的印象,3140億參數太多了,你需要一堆H100,不過(guò)我已經(jīng)買(mǎi)下了」。

一條磁力鏈,全球首個(gè)最大模型開(kāi)源
這次xAI開(kāi)源Grok-1,遵守的是Apache-2.0許可證,因此,用戶(hù)可以自由使用、修改和分發(fā)軟件。存儲庫包含了用于加載和運行Grok-1開(kāi)源權重模型的JAX示例代碼。用戶(hù)需要下載checkpoint,將ckpt-0目錄放置在checkpoint中,隨后運行以下代碼來(lái)測試:pip install -r requirements.txtpython run.py
這個(gè)腳本會(huì )在測試輸入上,加載checkpoint和模型中的樣本。
由于模型較大,參數達到了314B參數,因此需要具有足夠GPU內存的計算機,才能使用示例代碼測試模型。而且,由于此存儲庫中MoE層的實(shí)現效率不高,選擇該實(shí)現是為了避免需要自定義內核來(lái)驗證模型的正確性。通過(guò)Torrent客戶(hù)端和下面這個(gè)磁力鏈接,就可以下載權重了。magnet:?xt=urn:btih:5f96d43576e3d386c9ba65b883210a393b68210e&tr=https%3A%2F%2Facademictorrents.com%2Fannounce.php&tr=udp%3A%2F%2Ftracker.coppersurfer.tk%3A6969&tr=udp%3A%2F%2Ftracker.opentrackr.org%3A1337%2Fannounce



- tokenizer詞匯量:131,072(于GPT-4類(lèi)似)相當于2^17
- 嵌入大?。?144(48*128)
- Transformer層:64(每一層都有一個(gè)解碼層:多頭注意塊和密度塊)
- 鍵值大?。?28
密集塊(密集前饋塊):
- 寬度因子(Widening Factor):8
- 隱藏層大小為32768每個(gè)token從8個(gè)專(zhuān)家中選出2個(gè)。
- 上下文長(cháng)度:8192個(gè)token
- 精度:bf16

網(wǎng)友:開(kāi)源爭霸戰要來(lái)
AI社區已經(jīng)沸騰了!
技術(shù)界指出,Grok的亮點(diǎn)是在前向反饋層中使用了GeGLU以及歸一化方法,并且使用了有趣的三明治范式技術(shù)(sandwich norm technique)。
連OpenAI的員工,都表示了自己對Grok的強烈興趣。








馬斯克為何選擇開(kāi)源?
在數次嘲諷OpenAI是「CloseAI」之后,馬斯克果真選擇了開(kāi)源自家大模型。
當然,這背后肯定也有商業(yè)上的考量。作為市場(chǎng)領(lǐng)導者的OpenAI,是沒(méi)有理由開(kāi)源ChatGPT背后模型代碼的。現在,通過(guò)發(fā)布Grok的代碼,馬斯克將自己牢牢扎根在后者的陣營(yíng)中。這一決定,或許能讓他的xAI超越Meta和Mistral AI。Llama的開(kāi)源給Meta帶來(lái)了很多好處,幾乎讓小扎從元宇宙的泥潭爬了出來(lái)。



*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。