性能優(yōu)于RTX 4090!摩爾線(xiàn)程千卡智算集群助力國產(chǎn)大模型訓推
以大模型為代表的新一代人工智能技術(shù)是引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰略性技術(shù)和重要驅動(dòng)力量,隨著(zhù)對算力需求的日益高漲,人工智能算力底座公司日益成為新一波人工智能技術(shù)浪潮重要組成部分。
2024年5月,摩爾線(xiàn)程與智譜AI開(kāi)展了新一輪GPU 大模型適配及性能測試,包括大模型推理以及基于夸娥(KUAE)千卡智算集群的大模型預訓練。測試用相關(guān)大模型來(lái)自智譜AI基座大模型及其開(kāi)源版本。
測試結果表明,在推理方面,摩爾線(xiàn)程自研全功能GPU顯著(zhù)優(yōu)于基準對比產(chǎn)品RTX 3090和RTX 4090,在全部測試用例中優(yōu)于RTX 3090,在多batch下優(yōu)于RTX 4090;在訓練方面,摩爾線(xiàn)程夸娥千卡智算集群訓練精度與A100集群誤差在1%以?xún)?,夸娥千卡智算集群性能擴展系數超過(guò)90%,模型算力利用率(MFU)與A100集群相當。
智譜AI致力于打造新一代認知智能大模型,專(zhuān)注于做大模型的中國創(chuàng )新。早在2022年8月,智譜AI開(kāi)源了GLM-130B模型,2023 年,智譜 AI 推出千億基座對話(huà)模型ChatGLM,開(kāi)源版本的 ChatGLM-6B 讓大模型開(kāi)發(fā)者的本地微調和部署成為可能,在開(kāi)源社區受到廣泛歡迎。從自主開(kāi)發(fā)的原創(chuàng )GLM預訓練框架搭建之初,智譜AI就十分注意算力利用率問(wèn)題。通過(guò)國產(chǎn)算力適配,智譜AI已支持10余種國產(chǎn)硬件生態(tài),努力推動(dòng)建設大模型軟硬件生態(tài)和與國產(chǎn)芯片企業(yè)的聯(lián)合創(chuàng )新與升級。
摩爾線(xiàn)程出色的測試結果對于更好建設中國大模型產(chǎn)品技術(shù)生態(tài)具有重要意義。
▽ 技術(shù)自主新突破:摩爾線(xiàn)程千卡智算集群成功應用ChatGLM預訓練,標志著(zhù)摩爾線(xiàn)程全功能GPU算力底座有能力支撐行業(yè)領(lǐng)先的大模型全鏈條研發(fā),有助于增強技術(shù)自主性,保障信息安全。大模型訓練與推理將能夠在全國產(chǎn)可控的算力底座上運行,在滿(mǎn)足信息安全的前提下服務(wù)于千行百業(yè),成為發(fā)展AI+新質(zhì)生產(chǎn)力的核心力量。
▽ 助力打破算力瓶頸:Scaling laws(尺度定律)已經(jīng)預示了AGI技術(shù)發(fā)展對算力日益增長(cháng)的需求規律,同時(shí)也表明有限的算力供應可能成為制約大模型發(fā)展的關(guān)鍵瓶頸。本次測試結果顯示,國產(chǎn)GPU算力底座有能力助力中國人工智能技術(shù)發(fā)展。摩爾線(xiàn)程作為國產(chǎn)GPU的代表,將助力提高大模型迭代速度和自研水平,助推中國大模型更好發(fā)展。
▽ 開(kāi)拓創(chuàng )新空間:算法、算力、數據是AGI技術(shù)的核心要素,摩爾線(xiàn)程與智譜AI卓有成效的適配與測試合作,有利于推動(dòng)實(shí)現軟硬件的深度融合與協(xié)同創(chuàng )新,有利于助力中國大模型實(shí)現更好發(fā)展。
▽ 降低運營(yíng)成本:摩爾線(xiàn)程憑借自研國產(chǎn)全功能GPU,致力于構建先進(jìn)的AGI算力底座,不僅能夠兼容適配全球主流AI軟件生態(tài),節約軟件遷移成本,而且在單位算力總體擁有成本上擁有較為明顯優(yōu)勢,能夠有效降低大模型產(chǎn)品研發(fā)成本。
智譜AI硬件適配與測試負責人表示:“摩爾線(xiàn)程夸娥千卡智算集群在計算精度和穩定性等方面的表現令人印象深刻,智譜AI將與包括摩爾線(xiàn)程在內的大模型產(chǎn)業(yè)生態(tài)合作伙伴攜手,共同推動(dòng)大模型產(chǎn)業(yè)生態(tài)繁榮發(fā)展?!?/p>
來(lái)源:摩爾線(xiàn)程
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。