<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 嵌入式實(shí)時(shí)面部檢測應用設計指南

嵌入式實(shí)時(shí)面部檢測應用設計指南

作者: 時(shí)間:2013-01-15 來(lái)源:網(wǎng)絡(luò ) 收藏

本文引用地址:http://dyxdggzs.com/article/148138.htm

  單指令多數據(SIMD)架構能夠在多數據元上運行單指令,從而縮短代碼長(cháng)度并提高性能。使用向量處理器架構,可通過(guò)加法器/減法器并行數量因子,加速這些積分和的計算。如果向量寄存器可以加載16像素,而且這些像素可同時(shí)加到下一向量,加速因子是16.顯然,為處理器增加類(lèi)似的向量處理單元可以使這一因子翻倍。

  在下一階段,在多個(gè)位置及按多種尺度掃描圖像。采用Adaboost強大的區分器(以矩形特征為基礎的區分器),以決定搜索窗口是否包含。再一次,向量處理器具有明顯的優(yōu)勢 - 具有同時(shí)將多個(gè)位置數據與閾值進(jìn)行對比的能力。

  假設在一個(gè)圖像中,大多數子圖像都不是例,可以提供的并行比較器越多,加速越快。

  例如,如果架構具有在1個(gè)循環(huán)中比較8個(gè)要素中的2個(gè)向量的能力,則排除16個(gè)位置的子圖像僅需1個(gè)循環(huán)。為了簡(jiǎn)化數據加載,并且高效率地利用向量處理器加載/儲存,各個(gè)位置可以在空間上彼此接近。

  為了獲得高度并行的代碼,架構應支持指令預測。這樣可以使如果-則-否則(if-then-else)構造導致的分支用順序碼來(lái)代替,從而減少循環(huán)數和縮短代碼長(cháng)度。允許條件執行,有能力綜合各種條件,在控制代碼中實(shí)現更高的效率。此外,非順序碼,如分支和回路,經(jīng)具有零循環(huán)損失,而不需要煩瑣的技術(shù),如動(dòng)態(tài)分支預測和增加RISC處理器功率損耗的推理執行。

  一個(gè)關(guān)鍵的挑戰是存儲器帶寬,該需要對每幀視頻流進(jìn)行掃描,以執行面部。由于其數據量較大,視頻流無(wú)法儲存在緊耦合存儲器(TCM)中。例如,一個(gè)YUV 4:2:0格式的高清幀占用了3MB數據存儲器。這種高存儲器帶寬導致功率損耗更高,并需要更昂貴的DDR存儲器,從而使材料清單成本更高。一個(gè)完美的解決方案是采用數據分塊(data tiling)來(lái)儲存像素,其中2維數據塊在單次突發(fā)中由DDR存取,極大地改善了DDR的效率。直接存儲器存?。―MA)可以在外部存儲器和核心存儲器子系統之間傳輸數據。在最終面部階段,包含檢測面部的子圖像尺寸重新調整到固定尺寸輸出窗口。

  當圖像在多個(gè)比例掃描時(shí),還在檢測階段使用圖像尺寸調整過(guò)程。尺寸調整算法廣泛應用于圖像處理,用于視頻放大和縮小。面部檢測應用中執行的算法是雙三次算法。三次卷積插值根據離規定輸入坐標最近的16個(gè)像素的加權平均值來(lái)確定灰度值,并將該值分配給輸出坐標。首先,在一個(gè)方向(水平方向)上執行四個(gè)一維三次卷積,然后,在垂直方向執行更多個(gè)一維三次卷積。這意味著(zhù)要執行一個(gè)二維三次卷積,而所需的是一個(gè)一維三次卷積。

  向量處理器內核具有強大的加載-儲存能力,能夠快速、有效地存取數據是此類(lèi)應用的關(guān)鍵特征,其中算法在數據塊上運行??赏ㄟ^(guò)在單循環(huán)中從存儲器訪(fǎng)問(wèn)2維存儲器塊來(lái)滿(mǎn)足尺寸調整算法優(yōu)化。

  這一特點(diǎn)使處理器能夠有效地實(shí)現較高的存儲器帶寬,不需要載入不必要的數據或執行數據操作的負荷計算單元。此外,能夠在數據存取期間轉置數據且不存在任何循環(huán)損失,這使得轉置的數據塊能夠在單一循環(huán)中存取,對于執行水平過(guò)濾和垂直過(guò)濾非常切實(shí)可行。處理器的功率是其執行強大卷積能力的結果,可以在單一循環(huán)中執行并行的過(guò)濾器。

  這里是一個(gè)有效解決方案的實(shí)例。在一個(gè)循環(huán)中加載4x8字節塊,然后每個(gè)迭代利用4個(gè)像素,在垂直方向執行三次卷積。這4個(gè)像素預先安排在4個(gè)獨立的向量寄存器中,因此,我們能夠同時(shí)獲得8個(gè)結果。然后,同時(shí)對這些中間結果進(jìn)行準確處理,但是,以轉置格式加載這些數據,從而完成水平過(guò)濾。為了保持結果準確度,需要用結果四舍五入值(rounding value)和后移(post-shift)初始化。過(guò)濾器配置應當在不要求專(zhuān)門(mén)指令的條件下實(shí)現這些特征。

  總之,這種并行向量處理解決方案核心可在加載/儲存單元操作和處理單元之間實(shí)現平衡。一般說(shuō)來(lái),數據帶寬限制及就功耗和晶片面積而言的處理單元的成本限制了執行效率;不過(guò),顯然,可以實(shí)現標量處理器架構的重要加速。

  多媒體器件的多用途可編程HD視頻和圖像平臺

  CEVA-MM3000是可以集成到SoC中的可擴展的完全可編程多媒體平臺,以全軟件形式提供1080p 60fps視頻解碼和編碼、ISP功能和視覺(jué)應用。該平臺由兩個(gè)專(zhuān)用處理器,即流處理器和向量處理器組成,集成到一個(gè)完整的多核系統中,包括本地存儲器和共享存儲器、外設、DMA和與外部總線(xiàn)的標準橋接。這款全面的多內核平臺專(zhuān)為滿(mǎn)足移動(dòng)產(chǎn)品和其它消費者電子產(chǎn)品的低功耗要求而。

  向量處理器包括兩個(gè)獨立的向量處理單元(VPU)。VPU負責所有的向量計算,包括向量間運算(利用單指令多數據流)和向量?jì)炔窟\算。向量間指令可在16個(gè)8位(字節)或8個(gè)16位(字)元上運行,可以使用向量寄存器對,形成32位(雙字)元。VPU具有在單循環(huán)中完成6個(gè)線(xiàn)路(taps)中8個(gè)并行濾波器(taps)的能力。

  雖然VPU是作為向量處理器的計算主力,但是,向量加載和儲存單元(VLSU)作為從數據存儲器子系統向向量處理器及從向量處理器向數據存儲器子系統傳輸數據的工具。VLSU具有適用于加載和儲存操作的256位帶寬,并支持不對齊(non-aligned)存取。VLSU備有在單循環(huán)中存取二維數據塊的能力,并支持不同的數據塊尺寸。

加載4x4像素塊

  圖4:加載4x4像素塊

  為了簡(jiǎn)化VPU任務(wù),在讀/寫(xiě)向量寄存器時(shí),VLSU可以靈活地操作數據結構。在數據存取期間,數據塊可以轉置,而不存在任何循環(huán)損失,能夠在單循環(huán)中實(shí)現轉置數據塊的存取。轉置功能可以動(dòng)態(tài)設定或清除。采用這種方式,水平過(guò)濾器和垂直過(guò)濾器可以重復使用相同的功能,從而節省每個(gè)過(guò)濾器的開(kāi)發(fā)和調試時(shí)間,同時(shí)縮小程序存儲器的占位面積。

  結論

  對于采用CEVA-MM3000平臺的消費產(chǎn)品來(lái)說(shuō),視覺(jué)應用是有效地執行算法多樣性的一個(gè)實(shí)例,例如具備裁剪和尺寸調整功能的面部檢測。根據預測,將來(lái)類(lèi)似的和更復雜的應用需求將會(huì )增長(cháng),所有這些應用都可以利用CEVA-MM3000架構的可編程性和可擴展性。

linux操作系統文章專(zhuān)題:linux操作系統詳解(linux不再難懂)
光電開(kāi)關(guān)相關(guān)文章:光電開(kāi)關(guān)原理

上一頁(yè) 1 2 下一頁(yè)

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>