最強開(kāi)源大模型亮相:開(kāi)發(fā)2個(gè)月,花費約1000萬(wàn)美元
3月28日消息,美國當地時(shí)間周三,企業(yè)軟件公司Databricks宣布推出了新的開(kāi)源人工智能模型DBRX,聲稱(chēng)這一模型在開(kāi)源人工智能領(lǐng)域的效率和性能上樹(shù)立了新的行業(yè)標準。
本文引用地址:http://dyxdggzs.com/article/202403/456927.htmDatabricks宣稱(chēng),DBRX模型擁有1320億個(gè)參數,在語(yǔ)言理解、編程和數學(xué)技能等關(guān)鍵領(lǐng)域的基準測試中,其性能超過(guò)了其他領(lǐng)先的開(kāi)源人工智能模型,包括Meta的Llama 2-70B和法國初創(chuàng )企業(yè)Mixtral AI的模型。
雖然DBRX在某些原始功能上還無(wú)法與OpenAI的GPT-4相比,但Databricks高管表示,DBRX無(wú)疑是一個(gè)功能遠超GPT-3.5的替代產(chǎn)品,并且成本只是GPT-3.5的一小部分。
Databricks的首席執行官阿里·戈德西(Ali Ghodsi)在新聞發(fā)布會(huì )上表示:“我們非常高興能向全世界展示DBRX,并帶動(dòng)整個(gè)行業(yè)向更強大、更高效的開(kāi)源人工智能方向前進(jìn)。雖然GPT-4這類(lèi)基礎模型無(wú)疑是極其優(yōu)秀的通用工具,但Databricks專(zhuān)注于為客戶(hù)量身打造模型,這些模型能深入解析他們的專(zhuān)有數據。DBRX的發(fā)布正體現了我們實(shí)現該目標的決心?!?/p>
創(chuàng )新的“專(zhuān)家混合”架構
Databricks的研究團隊揭示了DBRX模型的關(guān)鍵創(chuàng )新之處——“專(zhuān)家混合”架構。這一架構使DBRX與其他競爭模型顯著(zhù)不同,后者往往利用所有參數生成每個(gè)單詞。相較而言,DBRX巧妙地整合了16個(gè)專(zhuān)家子模型,并在實(shí)時(shí)處理中為每個(gè)token準確挑選最相關(guān)的四個(gè)子模型。
這種設計的巧妙之處在于,它使DBRX在任何時(shí)刻只需激活360億個(gè)參數,因而實(shí)現了更高的性能輸出。這不僅顯著(zhù)提高了模型的處理速度,還大幅降低了運行成本,使其更為高效和經(jīng)濟。
這一創(chuàng )新策略是基于Mosaic團隊在早期Mega-MoE項目上的進(jìn)一步研究而開(kāi)發(fā)的。Mosaic團隊是去年被Databricks收購的一個(gè)研究部門(mén)。
戈德西高度評價(jià)了Mosaic團隊的貢獻,他表示:“多年來(lái),Mosaic團隊在更高效訓練基礎人工智能模型方面取得了顯著(zhù)進(jìn)步。正是他們的努力讓我們能夠迅速開(kāi)發(fā)出如DBRX這般卓越的人工智能模型。實(shí)際上,開(kāi)發(fā)DBRX只用了約兩個(gè)月時(shí)間,成本大概在1000萬(wàn)美元左右?!?/p>
推進(jìn)Databricks的企業(yè)AI戰略
通過(guò)將DBRX開(kāi)源,Databricks的目標不僅是在前沿人工智能研究領(lǐng)域確立其領(lǐng)導者地位,而且還希望促進(jìn)其創(chuàng )新架構在整個(gè)行業(yè)中的更廣泛采用。此外,DBRX也致力于支持Databricks的核心業(yè)務(wù)——為客戶(hù)定制和托管基于其專(zhuān)有數據集的人工智能模型。
在如今的市場(chǎng)環(huán)境中,很多Databricks的客戶(hù)都依賴(lài)于OpenAI及其他供應商提供的GPT-3.5等模型來(lái)支撐其業(yè)務(wù)運作。然而,將敏感的企業(yè)數據托管給第三方,常常會(huì )激起關(guān)于安全性和合規性的一系列擔憂(yōu)。
針對這一點(diǎn),戈德西表示:“我們的客戶(hù)相信,Databricks能夠妥善處理跨國界數據監管的問(wèn)題。他們已在Databricks平臺上存儲并管理了龐大數據量?,F在,有了DBRX以及Mosaic的定制模型功能,客戶(hù)們能夠在保障數據安全的同時(shí),充分利用先進(jìn)人工智能技術(shù)帶來(lái)的諸多益處?!?/p>
在日益激烈的競爭中占據一席之地
隨著(zhù)DBRX的推出,Databricks在核心數據和人工智能平臺業(yè)務(wù)領(lǐng)域面臨著(zhù)激烈的競爭。競爭對手諸如數據倉庫巨頭Snowflake已通過(guò)推出自有的人工智能服務(wù)Cortex,復制了Databricks的部分功能。同時(shí),亞馬遜、微軟和谷歌等領(lǐng)先的云計算服務(wù)供應商也正紛紛在其技術(shù)堆棧中集成生成式人工智能功能。
Databricks借助其開(kāi)創(chuàng )性的開(kāi)源項目DBRX,自詡具備最前沿的人工智能研究能力,旨在確立自身作為該領(lǐng)域領(lǐng)導者的地位,并吸引頂尖的數據科學(xué)人才。這一策略也反映了人們對大型科技公司將人工智能模型商業(yè)化的越來(lái)越多的抵制,許多人批評這些商業(yè)模型像“黑盒子”,缺乏透明度和可解釋性。
DBRX面臨的真正挑戰在于市場(chǎng)的接受程度以及它為Databricks客戶(hù)所創(chuàng )造的具體價(jià)值。在企業(yè)越來(lái)越多尋求利用人工智能推動(dòng)業(yè)務(wù)增長(cháng)和創(chuàng )新的同時(shí),還要保持對自有數據的控制,Databricks賭注于其尖端研究與企業(yè)級平臺的完美融合能夠讓它在競爭中脫穎而出。
Databricks已經(jīng)向大型科技公司及開(kāi)源社區的競爭對手拋出了挑戰,要求他們在創(chuàng )新上與其一較高下。人工智能領(lǐng)域的競爭日趨激烈,而Databricks已明確宣布其志在成為這場(chǎng)競爭的關(guān)鍵力量。
評論