<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 嵌入式片上存儲器有效使用的方法

嵌入式片上存儲器有效使用的方法

作者：時(shí)間：2011-08-09 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

引言

本文引用地址：http://dyxdggzs.com/article/150386.htm

　　隨著(zhù)CPU速度的迅速提高，CPU與片外存儲器的速度差異越來(lái)越大，匹配CPU與外部存儲器的方法通常是采用Cache或者片上存儲器。對于嵌入式設備上數據密集的應用，數據Cache與片上存儲器相比存在以下缺陷：①片上存儲器是固定的單周期訪(fǎng)問(wèn)，可在設計時(shí)(不是運行時(shí))研究數據訪(fǎng)問(wèn)模式;而Cache還要考慮不命中的情況，因而有可變的數據訪(fǎng)問(wèn)時(shí)間，執行時(shí)間的預測更加困難。②使用Cache執行時(shí)間的不可預測性影響編譯器的優(yōu)化。③細顆粒的Cache對于圖像編碼等的規則數據訪(fǎng)問(wèn)并不合適，因而使用Cache對于嵌入式設備可能不是最優(yōu)的。

對于大多數應用，使用片上存儲器比使用數據Cache能耗平均節省約40%，芯片面積與時(shí)間的乘積僅為Cache的46%，因而對于嵌入式多媒體處理器，片上RAM作為數據Cache的替代，功耗更低。片上存儲器的有效使用對于提高嵌入式應用的速度、降低功耗具有重要的意義。

　　TMS320C55x(簡(jiǎn)稱(chēng)為“C55x”)具有極低的功耗(0.05 mW/MIPS)，本文以C55x上的視頻編碼器為例，討論片上存儲器的有效使用。

　　1 數據的片外、片上動(dòng)態(tài)分配

　　因為片上存儲器比片外存儲器具有更強的數據訪(fǎng)問(wèn)能力和更低的訪(fǎng)問(wèn)功耗，所以盡可能分配數據到片上存儲器;未能分配到片上的數據可在CPU處理前轉移到片上;已經(jīng)轉移到片上的數據，應盡可能在片上保存，直到其生命期結束，以便盡可能減少數據從片外存儲器到片上存儲器的數據轉移。在視頻編碼等應用中，標量、常數相對矩陣而言，通常數量較少，可以分配到片上。若分配到片外，則在運算時(shí)直接存取片外數據，CPU流水線(xiàn)將會(huì )停滯。直接存儲器存取(DMA)可以在存儲器之間、存儲器與外設之間轉移數據，除了DMA通道參數初始化以外，DMA轉移數據和CPU處理數據可以并行進(jìn)行。設置DMA通道參數需要一定的時(shí)間，用DMA來(lái)轉移單個(gè)變量或常數的開(kāi)銷(xiāo)可能比直接存取更大，因此DMA適合轉移具有較多數據的矩陣，并不適合片外標量的轉移。包含大量元素的矩陣可以分配到片外，處理前使用DMA轉移到片上存儲器。

　　局部變量由編譯器分配到軟件棧上，C55x具有兩個(gè)軟件棧——數據棧和系統棧。C55x的棧有3種工作模式，可設置成雙16比特快返回模式，以減小棧所占的存儲器空間，并提高其運行速度。數據棧和系統棧在函數調用及返回時(shí)同時(shí)訪(fǎng)問(wèn)，可將這兩個(gè)棧分配到DARAM塊或者不同的SARAM塊內。

　　本文中數據存儲器的分配，強調從實(shí)際多媒體應用處理的基本數據塊出發(fā)，分析簡(jiǎn)單、直觀(guān)。多媒體算法總是將原始輸入數據分成一定大小的塊來(lái)處理，并產(chǎn)生對應該輸入的最后輸出。如果片上沒(méi)有足夠的存儲器，則大量的輸入數據和最后結果僅能存儲在片外。對于元素較多的矩陣，可以根據算法特征，將矩陣分成若干數據子塊，如H.263編碼器中的宏塊和搜索窗等，或者單純根據可得到的片上存儲器數最分成適當大小的子塊逐個(gè)運算，然后分析數據子塊的生命期和使用頻率。

　　這里定義數據子塊的生命期為首次使用到最后一次使用之間的間隔，而通常變量的生命期為定義到最后使用之間的間隔。例如，定義整型數組int MB[384]，用來(lái)存儲待編碼宏塊的數據，圖像的某個(gè)宏塊的數據在該宏塊編碼結束后，該宏塊數據的生命期也就結束}然后該數組用來(lái)存儲下一宏塊的數據，因而變量的生命期遠比存儲在該變量中的某一具體數據的生命期要長(cháng)。若數據子塊具有不相交的生命期，則可以共享相同的片上存儲器。很多數據子塊在運算中多次使用，可在首次運算前轉移到片上，并盡可能保存到生命期結束，即直到這些數據不再使用為止，因而這些數據僅需要一次轉移。將程序執行時(shí)間看成是由很多連續的時(shí)間間隔組成的，若在下個(gè)時(shí)間間隔內需要轉移新的數據到片上供CPU處理，而片上又沒(méi)有足夠的存儲器存儲這些數據，則這時(shí)將隨后需要蓮續頻繁使用的數據保留到片上。對于隨后較少使用的數據，若片外存儲器還保存有該數據的備份，則這些數據可直接覆蓋，等到下次使用時(shí)再從片外存儲器拷貝到片上;否則，在覆蓋前將數據轉移到片外。在片上分配一定的緩沖區，用來(lái)存儲需要再次使用的數據，可有效地減少片外存儲器的訪(fǎng)問(wèn)。對于中間結果，盡量在使用前分階段計算，使用后釋放，以縮減存儲中間結果的存儲器需求。通過(guò)數據的這種動(dòng)態(tài)分配，既可以減小或避免訪(fǎng)問(wèn)片外慢速存儲器所引起的指令延遲，又可以減少片外到片上的數據轉移。

　　在H.263視頻編碼器中，編碼是按宏塊順序進(jìn)行的。INTRA宏塊編碼不僅需要當前的編碼宏塊數據，還需要以當前宏塊為中心的重建圖像搜索窗。因此，根據算法特征將整幀輸入圖像劃分成宏塊，某個(gè)宏塊數據在編碼前轉移到片上，這一宏塊編碼結來(lái)后就不再使用，這部分片上存儲器就可釋放，用來(lái)存儲下一宏塊數據。若在編碼的同時(shí)采用DMA轉移下一個(gè)宏塊，則需要在片上分配兩個(gè)宏塊的存儲器空間，用來(lái)存儲編碼的原始圖像。

　　在進(jìn)行INTER幀的編碼時(shí)，運動(dòng)搜索需要使用前一幀的重建圖像作為參考。設搜索范圍為[-16，+16]，編碼該宏塊需要搜索參考圖像中以編碼宏塊位置為中心的9個(gè)宏塊，即前一幀中宏塊(x，y)的重建圖像，直到編碼(x+1，y+1)宏塊后生命期才結束。以CIF分辨率為例，不可能把一幀圖像的所有重建宏塊保存到生命期結束，因而部分重建圖像必須暫時(shí)存儲在片外。若在編碼(x-1，y-1)前將重建宏塊(x，y)拷貝到片上并一直保存到編碼(x+l，y+1)宏塊結束，則只需要在片上分配將近3個(gè)GOB的空間用來(lái)存儲參考圖像，就可以保證每個(gè)宏塊的重建圖像數據只需要一次片外到片上的轉移。

　　半像素內插結果，用于在整像素運動(dòng)搜索后作為半像素搜索的參考，因而可在整像素搜索后、半像素搜索前，圍繞整像素運動(dòng)矢量，對整像素運動(dòng)矢量對應的匹配宏塊進(jìn)行內插。這樣就沒(méi)有必要在編碼INTER幀前將整幀圖像進(jìn)行內插，可顯著(zhù)減少存儲內插結果的存儲器數量，從而分配在片上。

　　2 片上數據的存儲器分配

　　C55x除了讀指令的地址、數據總線(xiàn)外，還有3條用于從存儲器讀操作數的地址、數據總線(xiàn)，2條寫(xiě)操作數到存儲器的地址、數據總線(xiàn)。CPU在1個(gè)周期內可完成多個(gè)操作數的讀寫(xiě)，由于每個(gè)DARAM塊或SARAM塊的訪(fǎng)問(wèn)能力有限，這些操作數位于適當的DARAM或SARAM塊內，才能在單周期內完成多個(gè)數據的讀入或者數據的同時(shí)讀寫(xiě)，而不產(chǎn)生延遲。

　　2.1 指令代碼的分配

　　應用程序的指令代碼可以存儲在片外存儲器，通過(guò)指令Cache進(jìn)行訪(fǎng)問(wèn)，可以減少CPU讀指令代碼與CPU讀/寫(xiě)片上存儲器內數據的沖突，同時(shí)將空余更多的片上存儲器空間用于數據分配。若存儲程序代碼和數據所需的存儲器容量總和小于片上存儲器容量，那么將代碼分配到片外存儲器與代碼數據全部分配到片上存儲器相比，性能降低大約10%。因此當代碼和數據總和小于片上存儲器容量時(shí)，應該全部分配到片上存儲器。通常程序代碼僅供CPU讀取，并不修改;而數據經(jīng)常需要同時(shí)讀寫(xiě)，因而應盡量將代碼存儲在SARAM內，以便將訪(fǎng)問(wèn)能力更強的DARAM用來(lái)存儲數據。在單個(gè)CPU周期內，SARAM僅有一次訪(fǎng)問(wèn)能力，同時(shí)讀取指令和數據必然產(chǎn)生延遲，為了保證讀取數據時(shí)不產(chǎn)生延遲，數據不能與訪(fǎng)問(wèn)這些數據的代碼存儲在同一SARAM塊內。也就是說(shuō)，當程序代碼大小不是剛好整數個(gè)塊時(shí)，可通過(guò)調整代碼或者數據的存儲器分配，避免CPU讀代碼與讀/寫(xiě)數據發(fā)生沖突。

　2.2 數據分配

　　前面已經(jīng)討論過(guò)變量和常數的分配，這里主要討論的耗時(shí)較多的矩陣運算，通?？诙∫杂肅語(yǔ)言或者匯編語(yǔ)言編寫(xiě)應用程序，C語(yǔ)言編譯后可產(chǎn)生匯編代碼。在匯編語(yǔ)言的代碼中，找到處理矩陣操作數的指令，依次列舉這些指令不產(chǎn)生延遲的矩陣分配限制，并求解滿(mǎn)足這些限制條件的片上存儲器分配。

　　不產(chǎn)生延遲的約束條件可分成兩類(lèi)基本約束條件：

linux操作系統文章專(zhuān)題:linux操作系統詳解（linux不再難懂）

上一頁(yè) 1 2 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：方法使用有效 存儲器 嵌入式

評論

相關(guān)推薦

華清遠見(jiàn)嵌入式在線(xiàn)視頻教程——2、嵌入式系統的選擇與開(kāi)發(fā)

視頻華清遠見(jiàn) 嵌入式 | 2008-07-09

HBM之后存儲器市場(chǎng)掀起新風(fēng)暴

網(wǎng)絡(luò )與存儲 HBM 存儲器 | 2024-06-27

使用Timer IC555的負電壓發(fā)生電路

設計方案使用 Timer IC555 電壓發(fā)生電路 | 2009-07-06

江波龍DDR3L解決方案

網(wǎng)絡(luò )與存儲江波龍存儲嵌入式 | 2024-05-31

嵌入式開(kāi)發(fā)者都該了解的十大算法

嵌入式開(kāi)發(fā)者算法 | 2024-07-16

嵌入式操作系統大比拼

jackwang | 2002-05-13

大家在互相借鑒吧!--嵌入式系統詞匯表

jackwang | 2002-05-14

2024 CCF嵌入式技術(shù)生態(tài)與產(chǎn)業(yè)發(fā)展論壇(CCF ETIF 2024)邀請函

嵌入式系統 CCF 嵌入式 | 2024-07-16

擴展輸出幅度的兩種方法

設計方案擴展輸出幅度兩種方法 | 2009-07-06

STM32的結構解析STM32的結構解析

嵌入式系統嵌入式 STM32 | 2024-06-26

華清遠見(jiàn)嵌入式在線(xiàn)視頻教程——3、嵌入式Linux開(kāi)發(fā)應用介紹

視頻華清遠見(jiàn) 嵌入式 | 2008-07-09

EEPW攜手2024國際嵌入式展打造豐富技術(shù)盛宴

嵌入式系統嵌入式上海國際嵌入式 MCU | 2024-06-05

2024上海嵌入式展如何？夠垂直！

嵌入式系統嵌入式江波龍凌華 Lattice 鼎陽(yáng)科技貿澤電子 IAR 樹(shù)莓派普源精電易靈思 | 2024-06-14

半導體行業(yè)出現六項合作案！

嵌入式系統嵌入式 MCU 晶圓代工 | 2024-06-03

華清遠見(jiàn)嵌入式在線(xiàn)視頻教程——1、走近嵌入式系統

視頻華清遠見(jiàn) 嵌入式 | 2008-07-08

使用Timer IC的升壓電路

設計方案使用 Timer 升壓電路 | 2009-07-06

大家在互相借鑒吧!--嵌入式系統詞匯表

jackwang | 2002-05-14

高速PCB設計指南之三

資源下載 PCB 可測試性存儲器 JTAG 混合信號信號完整性 | 2007-12-29

大家在互相借鑒吧!--嵌入式系統詞匯表

jackwang | 2002-05-14

合約價(jià)勁漲護身 DRAM不怕淡季 Q1營(yíng)收季增

網(wǎng)絡(luò )與存儲存儲器 DRAM TrendForce | 2024-06-17

Motorola M68HC11單片機原理、應用及技術(shù)手冊

資源下載 Motorola 單片機存儲器中斷定時(shí)器 M68HC11 | 2008-01-02

華清遠見(jiàn)嵌入式在線(xiàn)視頻教程——5、嵌入式Linux移植和u-boot

視頻華清遠見(jiàn) 嵌入式 | 2008-07-14

研華：AI引領(lǐng)邊緣計算變革，打造嵌入式產(chǎn)業(yè)新未來(lái)

智能計算研華 AI 邊緣計算嵌入式 | 2024-05-31

C語(yǔ)言程序設計及應用實(shí)例

資源下載 atmel 單片機 AD DA 存儲器中斷 | 2008-01-02

華清遠見(jiàn)嵌入式在線(xiàn)視頻教程——4、基于A(yíng)RM的嵌入式開(kāi)發(fā)

視頻華清遠見(jiàn) 嵌入式 | 2008-07-14

1兆位5伏閃速電擦除存儲器AT29C010A及其應用

資源下載存儲器閃速電擦除 AT29C010A 1兆位5伏 | 2007-12-25

使用NPN和PNP的均衡型直流放大電路

設計方案使用均衡型直流放大電路 | 2009-07-06

介紹DSP外部電路設計的經(jīng)典著(zhù)作

資源下載 TI Dsp 外圍電路 AD\DA 數字上\下變頻存儲器 | 2007-12-25

大家在互相借鑒吧!--嵌入式系統詞匯表

jackwang | 2002-05-14

使用NPN和PNP的非反轉直流放大電路

設計方案使用反轉直流放大電路 | 2009-07-06

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>