英特爾Gaudi 2D AI加速器為DeepSeek Janus Pro模型提供加速
近日,DeepSeek發(fā)布Janus Pro模型,其超強性能和高精度引起業(yè)界關(guān)注。英特爾? Gaudi 2D AI加速器現已針對該模型進(jìn)行優(yōu)化,這使得AI開(kāi)發(fā)者能夠以更低成本、更高效率實(shí)現復雜任務(wù)的部署與優(yōu)化,有效滿(mǎn)足行業(yè)應用對于推理算力的需求,為AI應用的落地和規?;l(fā)展提供強有力的支持。
本文引用地址:http://dyxdggzs.com/article/202502/466723.htm作為一款創(chuàng )新性的 AIGC模型,DeepSeek Janus模型集成了多模態(tài)理解和生成功能。該模型首次采用統一的Transformer架構,突破了傳統AIGC模型依賴(lài)多路徑視覺(jué)編碼的限制,實(shí)現了理解與生成任務(wù)的一體化支持。在此基礎上,Janus Pro通過(guò)優(yōu)化訓練策略和擴展模型規模,顯著(zhù)提升了文生圖等功能的性能與穩定性,并提供了10億參數和70億參數兩個(gè)版本,在性能與精度上展現了較強的競爭力。
在Janus Pro統一的Transformer架構下,文生圖模型的吞吐量高低已經(jīng)從依賴(lài)加速器的高算力向充分利用HBM內存高帶寬和大容量轉換。英特爾? Gaudi 2D憑借 2.45TB/秒的高帶寬和 96GB HBM 大容量?jì)却?,?Janus Pro 模型提供了強大的計算支持,使其在生圖批處理任務(wù)中,隨著(zhù)批量大?。˙atch Size)的增加,吞吐性能得到顯著(zhù)提升,大幅縮短任務(wù)處理時(shí)間。
與此同時(shí),結合英特爾Optimum-Habana 框架的優(yōu)化,英特爾? Gaudi 2D顯著(zhù)提升了文生圖任務(wù)的吞吐性能和推理效率,僅需約 10 秒即可生成16張高質(zhì)量的圖片,性能表現卓越。而且,開(kāi)發(fā)者僅需調整數行代碼,即可實(shí)現這一結果,極大降低了開(kāi)發(fā)門(mén)檻和遷移成本,為 AI 應用的高效部署提供便利。
圖片來(lái)源:利用英特爾Gaudi 2D AI加速器運行DeepSeek Janus-Pro-7B模型生成
此外,DeepSeek的蒸餾模型在至強和Gaudi平臺上也得到了支持,能夠為客戶(hù)創(chuàng )造更好的總體擁有成本(TCO),推動(dòng)AI的普惠。
一直以來(lái),英特爾始終秉承開(kāi)放的態(tài)度,并通過(guò)軟硬件相結合的方式推動(dòng)AI應用落地。目前,英特爾豐富的AI產(chǎn)品組合,包括英特爾?至強?處理器、英特爾?酷睿? Ultra處理器和英特爾銳炫?顯卡等,已經(jīng)針對業(yè)界超過(guò)500個(gè)開(kāi)源AI模型提供支持,廣泛涵蓋DeepSeek、Llama 3.1和通義千問(wèn)等。同時(shí),英特爾深耕開(kāi)放生態(tài),不僅以開(kāi)放生態(tài)系統軟件實(shí)現針對性?xún)?yōu)化,也通過(guò)打造企業(yè)AI開(kāi)放平臺(OPEA)為這些模型提供支持。
評論