<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 網(wǎng)絡(luò )與存儲 > 市場(chǎng)分析 > ISSCC 2025上的存算一體芯片

ISSCC 2025上的存算一體芯片

作者: 時(shí)間:2025-02-26 來(lái)源:半導體產(chǎn)業(yè)縱橫 收藏

當前, 邊緣智能計算設備部署神經(jīng)網(wǎng)絡(luò )時(shí), 往往需要通過(guò)訓練微調以提升網(wǎng)絡(luò )精度。但基于遠程云端訓練的方法存在高延遲、高功耗以及存在隱私泄露風(fēng)險等缺點(diǎn), 因此, 實(shí)現支持本地訓練的存算一體技術(shù)至關(guān)重要。

本文引用地址:http://dyxdggzs.com/article/202502/467330.htm

存算一體(Computing-in-Memory, CIM)技術(shù)是一種革命性的計算架構,通過(guò)將計算和存儲功能集成在同一芯片中,解決了傳統馮?諾依曼架構中的 「內存墻」 問(wèn)題。隨著(zhù)人工智能、邊緣計算和數據中心等領(lǐng)域的快速發(fā)展,存算一體技術(shù)因其高效能、低功耗的特點(diǎn),成為未來(lái)計算架構的重要方向

傳統的存算一體宏僅支持網(wǎng)絡(luò )推理, 無(wú)法進(jìn)行網(wǎng)絡(luò )訓練所需要的轉置運算?,F有方案無(wú)法對訓練中的前向與反向傳播過(guò)程中的乘累加電路進(jìn)行有效的復用, 造成了功耗和面積上的浪費, 且僅支持定點(diǎn)數制的模擬存算方案, 在精度上也存在較大的缺陷。如何有效實(shí)現支持轉置操作的高能效、高精度的存算一體宏, 是當前存算一體領(lǐng)域亟須解決的問(wèn)題。

針對以上問(wèn)題, 集成電路制造技術(shù)全國重點(diǎn)實(shí)驗室張鋒研究員團隊設計出可轉置的近似精確雙模浮點(diǎn)存算一體宏芯片。

通過(guò)提出的循環(huán)權重映射 SRAM 方案, 芯片可在前向與反向傳播時(shí)復用乘加單元, 在實(shí)現了轉置功能的同時(shí), 相對之前的轉置存算一體宏單元大大提升了能效與算力密度。

通過(guò)提出的有符號定點(diǎn)尾數編碼方式與向量粒度預對齊方案, 芯片實(shí)現了多種浮點(diǎn)、定點(diǎn)數制的兼容支持, 相較于傳統的粗粒度浮點(diǎn)預對齊方案有著(zhù)更小的精度損失。

通過(guò)提出的近似精確雙模的乘加電路設計, 芯片可在精度要求低的推理環(huán)節時(shí)開(kāi)啟近似模式, 從而獲得 12% 的速度提升與 45% 的能耗降低, 可在精度要求高的訓練環(huán)節時(shí)開(kāi)啟精確模式確保沒(méi)有精度損失。

該存算一體宏芯片在 28nm CMOS 工藝下流片, 可支持 BF16、FP8 浮點(diǎn)精度運算以及 INT8、INT4 定點(diǎn)精度運算。BF16 浮點(diǎn)矩陣-矩陣-向量計算均值能效達到 48TFLOP/W, 峰值能效達到 100TFLOPS/W;FP8 浮點(diǎn)矩陣-矩陣-向量計算均值能效達到 192.3TFLOP/W, 峰值能效達到 400TFLOPS/W。這一研究結果為應用于邊緣端訓練的存算一體架構芯片提供了新思路。

上述工作以「A 28nm 192.3TFLOPS/W Accurate/Approximate Dual-mode Transpose Digital 6T-SRAM Compute-in-Memory Macro for Floating-Point Edge Training and Inference」為題入選 ISSCC 2025。微電子所博士生袁易揚為第一作者, 張鋒研究員與北京理工大學(xué)李瀟然助理教授為通訊作者。該研究成果得到了科技部重點(diǎn)研發(fā)計劃、國家自然科學(xué)基金、中國科學(xué)院戰略先導專(zhuān)項等項目的支持。


圖 1. 28nm 基于外積的數?;旌细↑c(diǎn)存算一體宏芯片:(a) 芯片顯微鏡照片,(b) 芯片特性總結表。

存算一體芯片的適用場(chǎng)景

中早期的存算一體芯片算力較小,從小算力 1TOPS 開(kāi)始往上走,解決的是音頻類(lèi)、健康類(lèi)及低功耗視覺(jué)終端側應用場(chǎng)景,AI 落地的芯片性能及功耗問(wèn)題。比如:AIoT 的應用。眾所周知,碎片化的 AIoT 市場(chǎng)對先進(jìn)工藝芯片的需求并不強烈,反而更青睞低成本、低功耗、易開(kāi)發(fā)的芯片。存算一體正是符合這一系列要求的芯片。

首先,存算一體技術(shù)能夠減少數據在存儲單元和計算單元之間的移動(dòng),從而顯著(zhù)降低能耗。例如,傳統架構中,大量的數據傳輸會(huì )消耗大量能量,而存算一體架構可以避免這種不必要的能耗,使得像電池供電的物聯(lián)網(wǎng)設備能夠更長(cháng)時(shí)間地運行。

其次,通過(guò)減少數據傳輸和提高集成度,存算一體技術(shù)可以降低芯片的制造成本。對于大規模部署的 AIoT 設備來(lái)說(shuō),成本的降低有助于更廣泛的應用推廣。

最后,存算一體芯片還可以大幅提高運算速度并節省空間,而這兩項也是給 AIoT 應用帶來(lái)助力的兩大因素。

目前云計算算力市場(chǎng),GPU 的單一架構已經(jīng)不能適應不同 AI 計算場(chǎng)景的算法離散化特點(diǎn),如在圖像、推薦、NLP 領(lǐng)域有各自的主流算法架構。隨著(zhù)存算一體芯片算力不斷提升,使用范圍逐漸擴展到大算力應用領(lǐng)域。針對大算力場(chǎng)景>100TOPS,在無(wú)人車(chē)、泛機器人、智能駕駛,云計算領(lǐng)域提供高性能大算力和高性?xún)r(jià)比的產(chǎn)品。此外,存算一體芯片還有一些其他延伸應用,比如感存算一體、類(lèi)腦計算等。



關(guān)鍵詞: CIM芯片

評論


技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>