英特爾宣布實(shí)現 MLPerf Client 0.6 基準測試首個(gè)全 NPU 支持
5 月 7 日消息,當地時(shí)間 5 月 5 日,英特爾宣布成為唯一在 MLPerf Client v0.6 基準測試中實(shí)現全 NPU 支持的企業(yè)。
本文引用地址:http://dyxdggzs.com/article/202505/470141.htm英特爾表示,該結果標志著(zhù)行業(yè)首個(gè)針對客戶(hù)端 NPU 的大語(yǔ)言模型(LLM)性能標準化評估。測試數據顯示,英特爾酷睿 Ultra 200 處理器在 GPU 和 NPU 上的輸出速度遠超人類(lèi)平均閱讀速度。
英特爾客戶(hù)端 PC 產(chǎn)品營(yíng)銷(xiāo)副總裁兼總經(jīng)理丹尼爾?羅杰斯(Daniel Rogers)表示,“我們很榮幸能夠引領(lǐng)行業(yè),實(shí)現客戶(hù)端 PC 平臺的全 NPU 加速和領(lǐng)先 GPU 性能?!?/p>
測試配置
AMD英特爾平臺華碩 Zenbook S 16華碩 Zenbook S 14型號UM5606WAUX5406SACPUAMD 銳龍 AI HX 370酷睿 Ultra 9 288VBIOS 日期2025 年 3 月 21 日2025 年 2 月 26 日BIOS 版本UM5606WA.317UX5406SA.306內存32GB LPDDR5,7500MHz32GB LPDDR5,8533 MHz顯卡AMD Radeon 890M英特爾 Arc 140V存儲1TB1TB操作系統Windows 11 專(zhuān)業(yè)版 x64
英特爾表示,在基于 Llama 2 7B 模型的四項內容生成與摘要測試中,英特爾在 NPU 和內置 Arc GPU 上均展現領(lǐng)先性能:
· 創(chuàng ) NPU 最快響應速度,首個(gè)詞元生成僅需 1.09 秒(首 token 延遲)
· 實(shí)現 NPU 最高吞吐量 18.55 tokens / 秒
· GPU 首 token 生成速度超越競品
MLPerf Client 由 MLCommons 聯(lián)盟成員(含英特爾、AMD、微軟、英偉達、高通)聯(lián)合開(kāi)發(fā),首次突破以 GPU 為核心的測試模式,新增專(zhuān)用 NPU 基準評估。
評論