<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 業(yè)界動(dòng)態(tài) > AI PC新突破端側首次支持128K上下文窗口實(shí)現2.2倍推理優(yōu)化

AI PC新突破端側首次支持128K上下文窗口實(shí)現2.2倍推理優(yōu)化

—— 90秒讀完300頁(yè)哈利波特，AI PC運行面壁大模型效率翻倍

作者：時(shí)間：2025-06-09 來(lái)源：EEPW

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

編者按：端側AI里程碑：面壁大模型+英特爾酷睿Ultra首日協(xié)同優(yōu)化效率提升220%；面壁智能端側大模型首日上線(xiàn)，英特爾工程師聯(lián)合優(yōu)化實(shí)現2.2倍推理效率躍升；AI PC時(shí)代加速：面壁智能端側大模型適配酷睿Ultra，效率提升220%；推理速率提升2.2倍！面壁推出MiniCPM 4.0系列LLM模型，英特爾助力帶來(lái)端側性能體驗；英特爾銳炫B60聯(lián)合面壁MiniCPM 4.0，端側首次支持高達128K上下文窗口

本文引用地址：http://dyxdggzs.com/article/202506/471196.htm

從協(xié)同設計到首日落地：面壁智能大模型如何在酷睿Ultra上實(shí)現2.2倍推理優(yōu)化

近日，面壁智能正式發(fā)布并開(kāi)源了「面壁小鋼炮」端側系列最新力作——MiniCPM 4.0模型，實(shí)現了端側可落地的系統級軟硬件稀疏化的高效創(chuàng )新。英特爾與面壁智能從模型開(kāi)發(fā)階段就緊密合作，實(shí)現了長(cháng)短文本多重推理效率的提升，端側AI PC 在Day 0全面適配，128K長(cháng)上下文窗口等多方面突破。

雙方開(kāi)展了深度技術(shù)協(xié)同，基于英特爾硬件架構定制投機解碼配置。通過(guò)硬件感知的草稿模型優(yōu)化策略，結合英特爾加速套件與KV Cache內存增強技術(shù)，實(shí)現端到端推理效率的2.2倍提升¹，攜手為業(yè)界帶來(lái)了全新的模型創(chuàng )新和端側性能體驗。

此次，面壁推出的MiniCPM 4.0系列LLM模型擁有 8B、0.5B 兩種參數規模，針對單一架構難以兼顧長(cháng)、短文本不同場(chǎng)景的技術(shù)難題，MiniCPM 4.0-8B 采用「高效雙頻換擋」機制，能夠根據任務(wù)特征自動(dòng)切換注意力模式：在處理高難度的長(cháng)文本、深度思考任務(wù)時(shí)，啟用稀疏注意力以降低計算復雜度，在短文本場(chǎng)景下切換至稠密注意力以確保精度，實(shí)現了長(cháng)、短文本切換的高效響應。

目前，具有CPU、GPU、NPU三個(gè)AI運算引擎的英特爾酷睿Ultra處理器已迅速對此適配，并借助OpenVINO? 工具套件為MiniCPM 4.0系列模型提供優(yōu)化的卓越性能表現。英特爾再次在NPU上對模型發(fā)布提供第零日（Day 0）支持，為不同參數量模型和應用場(chǎng)景提供更多樣化的、更有針對性的平臺支持。

CPU及AI處理引擎	? 模型	精度	1st Token延遲(毫秒)	2nd Token(每秒)
Intel^? Core? Ultra 7 258V(iGPU)	MiniCPM4-0.5B	FP16	59.94	87.62
Intel^? Core? Ultra 7 258V(NPU)	MiniCPM4-0.5B	FP16	141.99	67.46
Intel^? Core? Ultra 7 258V(iGPU)	MiniCPM4-8B	INT4-MIXED-ASYM	694.60	21.3
Intel^? Core? Ultra 7 258V(NPU)	MiniCPM4-8B	INT4-MIXED-CW-SYM	1315.89	17.65
Intel^? Core? Ultra 9 285H(iGPU)	MiniCPM4-0.5B	FP16	65.32	83.67
Intel^? Core? Ultra 9 285H(iGPU)	MiniCPM4-8B	INT4-MIXED-ASYM	645.63	21.39

* 上述測試評估了在int4混合精度和fp16精度設置下1K輸入的首詞元延遲和平均吞吐量。每項測試在預熱階段后執行三次，選取平均值作為報告數據。性能結果基于以下SKU1或SKU2配置²

在長(cháng)上下文窗口的技術(shù)創(chuàng )新方面，英特爾也有了新的突破。依托分塊稀疏注意力機制，結合深度算子融合與硬件驅動(dòng)的算法優(yōu)化，實(shí)現了長(cháng)文本緩存的大幅銳減，和推理效率的進(jìn)一步提升。在保證輸出質(zhì)量的前提下，我們首次在基于英特爾銳炫? Pro B60上將長(cháng)上下文窗口擴展至128K。相較于稠密模型，首Token延遲降低了38%3，Token速率提升多達3.8倍3。經(jīng)過(guò)這樣的提升，一整部300多頁(yè)的哈利波特小說(shuō)，可以在90秒內完成閱讀、分析和總結。這不僅極大地提升了AI PC的用戶(hù)體驗，也為解鎖更多端側AI新應用建立了強大的基礎。未來(lái)，英特爾將持續保持與面壁的深度合作和協(xié)同研發(fā)，進(jìn)一步提升長(cháng)上下文窗口應用的性能。對128K的文本輸入進(jìn)行處理的效果請參考視頻演示。

在當今數字化時(shí)代，人工智能技術(shù)正以前所未有的速度發(fā)展，英特爾作為全球領(lǐng)先的科技企業(yè)和AI PC的發(fā)起和倡導者，始終致力于推動(dòng)端側AI模型的創(chuàng )新發(fā)展。

此次合作不僅彰顯了英特爾在A(yíng)I領(lǐng)域的強大技術(shù)實(shí)力，也體現了其對創(chuàng )新生態(tài)系統的堅定承諾。通過(guò)整合雙方的技術(shù)優(yōu)勢和資源，英特爾平臺和MiniCPM 4.0系列模型聯(lián)合解決方案的廣泛應用和落地部署已經(jīng)奠定了堅實(shí)的基礎，有望在智能生活、生產(chǎn)力提升等多個(gè)場(chǎng)景中發(fā)揮關(guān)鍵作用。

展望未來(lái)，英特爾將繼續與面壁智能保持緊密合作，同時(shí)積極拓展合作關(guān)系，不斷探索AI技術(shù)的新邊界。英特爾致力于通過(guò)持續創(chuàng )新，推動(dòng)人工智能技術(shù)的普及與發(fā)展，構建更加智能、高效的未來(lái)社會(huì )。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：

評論

相關(guān)推薦

發(fā)光二極管的限流電阻如何取值

元件/連接器發(fā)光二極管萬(wàn)用表測量電路設計 | 2025-02-28

超聲波掃描轉換演示 OMAP3530 EVM

視頻 TI OMAP3530 | 2010-03-18

Windows2000下USB接口的IC卡讀寫(xiě)裝置客戶(hù)程序設計

資源下載 | 2007-02-14

多路防盜報警器(555)

設計方案多路防盜報警器 | 2009-07-06

科技行業(yè)已經(jīng)慢慢走出行業(yè)低谷期

liujt_ic | 2003-06-17

555構成的發(fā)光報警器

設計方案構成發(fā)光報警器 | 2009-07-06

CA3094構成的多種開(kāi)關(guān)報警器

設計方案 CA3094 構成多種開(kāi)關(guān) 報警器 | 2009-07-06

Windows 98下硬件中斷驅動(dòng)程序的開(kāi)發(fā)

資源下載 | 2007-02-14

上海半導體業(yè)今年新增投資逾25億美元

liujt_ic | 2003-06-17

協(xié)作機器人需求領(lǐng)跑，人形機器人應用前景樂(lè )觀(guān)

機器人協(xié)作機器人人形機器人 | 2025-02-28

紅外線(xiàn)聲光報臀器(555、LM386、KD9562)

設計方案紅外線(xiàn) 聲光報臀 LM386 KD9562 | 2009-07-06

[灌水]準備迎接論壇的No.10000會(huì )員!

amine | 2003-06-17

多路防盜無(wú)線(xiàn)報警器(CD4017、CH233)

設計方案多路防盜無(wú)線(xiàn) 報警器 CD4017 CH233 | 2009-07-06

VXI總線(xiàn)與虛擬儀器技術(shù)

資源下載 | 2007-02-14

我想提前慶祝??！

jackwang | 2003-06-17

用萬(wàn)用表確定三極管的種類(lèi)和3個(gè)極性

元件/連接器三極管萬(wàn)用表 | 2025-02-28

WIND-FLEX高速無(wú)線(xiàn)接口的結構及應用

資源下載 | 2007-02-14

納指重挫2.7%！英偉達狂瀉8.5%，市值蒸發(fā)2740億美元

智能計算英偉達特朗普芯片博通超微半導體費城半導體 | 2025-02-28

東方通信為轉型上市后首次虧損2.1億

liujt_ic | 2003-06-17

電源管理設計貼士

視頻 TI 電源管理 | 2010-03-18

糾錯成本大降90%！亞馬遜推出新款量子計算芯片Ocelot

智能計算亞馬遜量子計算芯片 Ocelot | 2025-02-28

GPT-4.5發(fā)布：比GPT-4提升10倍但\"并非前沿模型\"

智能計算 GPT-4.5 GPT-4 OpenAI LLM | 2025-02-28

以太網(wǎng)硬件電路設計方案有哪些？

網(wǎng)絡(luò )與存儲以太網(wǎng) 硬件電路電路設計 | 2025-02-28

ZigBee CC2480 社區視頻

視頻 TI ZigBee CC2480 | 2010-03-18

ADC需要注意哪些參數！

模擬技術(shù) ADC 電路設計 | 2025-02-28

ADC采集電路前級為啥加一個(gè)電壓跟隨器？

模擬技術(shù) 電壓跟隨器 ADC采集電路設計 | 2025-02-28

德州儀器 TMS320C6474 DSP 評估板

視頻 TI DSP TMS320C6474 | 2010-03-18

報道：Meta擬募350億美元加碼數據中心基建，Apollo牽頭領(lǐng)投

智能計算 Meta 數據中心基建 Apollo | 2025-02-28

低功耗射頻和德州儀器的解決方案

視頻 TI RF | 2010-03-18

VXI總線(xiàn)的接口芯片及其應用

資源下載 | 2007-02-14

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>