如何實(shí)現高性能的DSP處理
DMA也可以與高速緩存聯(lián)合使用。通常,DMA傳輸首先將高速外設中的數據讀入到處理器的外部存儲器,數據高速緩存則將數據從外部存儲器讀入到處理器內部。進(jìn)行這種操作通常需要使用“乒乓”緩沖器,一個(gè)緩沖區用于數據傳輸,另一個(gè)用于數據處理,圖2說(shuō)明了這種操作方式。DMA控制器將數據傳輸到 buffer0時(shí),處理器核則訪(fǎng)問(wèn)buffer1,反之亦然。
圖2:DMA和高速緩存聯(lián)合使用時(shí)數據一致性的維護。
當聯(lián)合使用DMA和高速緩存時(shí),維持DMA控制器讀入的數據與高速緩存中數據的一致性是很重要的,圖2說(shuō)明了如何完成這一操作。當外設生成新的數據,DMA控制器則將數據放置在一個(gè)新的緩沖區,并產(chǎn)生中斷,通知處理器核可以處理這些數據。當處理器核處理該緩沖區數據前,與該緩沖區相應的高速緩存行被設為無(wú)效,從而強制高速緩存從主存儲器中取出數據,這樣就可以確保一致性。這種方法主要的缺點(diǎn)是它不能達到單一DMA模型的性能,這里DMA控制器采用將緩沖區的數據直接讀入內部存儲器的模式。
指令劃分
指令劃分(instruction partitioning)通常比較簡(jiǎn)單。如果程序代碼能容納在內部存儲器中,只需要關(guān)閉指令高速緩存,直接把程序代碼映射到內部存儲器就可以獲得最大的效能。然而,多數應用程序代碼不能全部容納在內部存儲器中,所以必須打開(kāi)高速指令緩存。
高速緩存容量通常小于外部存儲器,但這并不是一個(gè)問(wèn)題,因為對于多數嵌入式軟件,“通常20%的程序代碼的運行時(shí)間占整個(gè)運行時(shí)間的80%”。大多數情況下,最耗時(shí)間的程序代碼都很小,足夠放置到高速緩存中,所以高速緩存器能夠充分發(fā)揮其作用。
為了提高性能,還可以使用指令的線(xiàn)鎖機制(line-locking mechanism),鎖定程序的最關(guān)鍵的部分代碼。如需要進(jìn)一步提高性能,可以關(guān)閉指令高速緩存并采用“存儲器覆蓋”的機制代替,該機制使用DMA將程序代碼傳輸到一個(gè)存儲器塊,而同時(shí)在另一個(gè)存儲器塊上執行操作。
數據劃分
數據劃分通常沒(méi)有指令劃分那么簡(jiǎn)單。和程序代碼劃分一樣,如果數據緩沖區可以被容納在內部存儲器中,你就沒(méi)有多余的工作。如果不是,首要任務(wù)就是要區分靜態(tài)數據(如用于查找表)和動(dòng)態(tài)數據。數據高速緩存在靜態(tài)數據方面使用較好,而DMA通常在動(dòng)態(tài)數據方面性能更佳。
即使使用了數據高速緩存,也通常需要設立一個(gè)外設DMA傳輸通道,將數據從外設傳輸到外部存儲器。如果采用了數據高速緩存,可以將這些數據讀入到內部存儲器,只要在訪(fǎng)問(wèn)數據前使高速緩存的緩沖區無(wú)效即可。如果正在使用DMA,則可以建立DMA傳輸,將數據從外部存儲器讀入到內部存儲器。
評論