<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 電源與新能源 > 設計應用 > 基于CUDA技術(shù)的視頻顯示系統的設計與開(kāi)發(fā)

基于CUDA技術(shù)的視頻顯示系統的設計與開(kāi)發(fā)

作者: 時(shí)間:2014-01-08 來(lái)源:網(wǎng)絡(luò ) 收藏

近年來(lái)隨著(zhù)大屏幕顯示技術(shù)在各領(lǐng)域應用的逐步深入,市場(chǎng)已經(jīng)不滿(mǎn)足單一的影片展示,更多的轉向了對互動(dòng)性更強的計算機桌面環(huán)境的融合顯示上來(lái)。而目前市場(chǎng)上主流的桌面融合系統,多采用分屏器等硬件輔助設備,成本高,性能差。

本文引用地址:http://dyxdggzs.com/article/227089.htm

統一計算架構(Compute Unified Device Architect-ure,CUDA)是英偉達(NVIDIA)公司近年來(lái)推出的通用并行計算架構,它以高性能顯卡GPU為硬件依托,采用CPU+GPU的混合計算極大的提高了大規模的圖形數據實(shí)時(shí)處理效率。本文設計的系統,采用CUDA開(kāi)發(fā)方式實(shí)現了計算機桌面圖片的分割計算、貝塞爾曲線(xiàn)擬合、以及融合圖像計算等三方面處理。實(shí)時(shí)性高,畫(huà)面數據計算理論上精確值1 4 像素,精度好。

1 系統框架設計

圖像處理的本質(zhì)是大規模矩陣運算,特別適合并行處理。但CPU 通用計算很難利用該特性。與此相反,GPU 在并行數據運算上具有強大的計算能力,特別適合作運算符相同而運算數據不同的運算,當執行具有高運算密度的多數據元素時(shí),內存訪(fǎng)問(wèn)的延遲可以被忽略。CUDA 編程模型將CPU 作為主機(Host ),GPU作為協(xié)處理器(Coprocessor)或設備(Device),一個(gè)系統中可以存在多個(gè)設備。在這個(gè)模型中,CPU 與GPU共同工作,CPU 負責邏輯性強的事務(wù)處理和串行計算,GPU 則專(zhuān)注于執行高度線(xiàn)程化的并行處理任務(wù)。

本系統以NVIDIA GeForce GTX470 搭建的計算平臺為運行環(huán)境,利用顯卡的多頭輸出特性,連接多臺投影儀組成拼接屏幕陣列,不需要額外增加其他硬件設備。由于桌面融合顯示系統要處理的圖像數據大、實(shí)時(shí)性高的特點(diǎn),所以本系統的軟件設計上則廣泛使用了多CPU并行編程技術(shù)和CUDA并行計算技術(shù),針對每一個(gè)投影設備的圖像處理和顯示,系統會(huì )分配一個(gè)專(zhuān)門(mén)的線(xiàn)程來(lái)處理。該線(xiàn)程會(huì )對應固定的CPU和固定的GPU計算核心,保證多投影設備完全并行處理,從而避免了其他系統由于顯示設備增多,處理數據變大而造成的性能下降。CUDA架構如圖1所示。

基于CUDA技術(shù)的視頻顯示系統的設計與開(kāi)發(fā)

本系統在設計中,首先設置定時(shí)器。定期采集控制屏幕圖像信息保存到公共存儲空間,然后針對外設顯示設備個(gè)數動(dòng)態(tài)的開(kāi)啟數個(gè)線(xiàn)程完成圖像的數據分割、圖像的數據融合以及圖像的顯示等工作。其中在線(xiàn)程開(kāi)啟初始就與固定的GPU 計算核心相關(guān)聯(lián),并把數據圖形分割和融合部分采用進(jìn)行實(shí)現,最后同樣采用定時(shí)器技術(shù)同步各個(gè)線(xiàn)程中圖像數據顯示工作。

通常采用貝塞爾曲線(xiàn)擬合方法來(lái)完成圖像數據的融合。該方法的一般做法是先由控制點(diǎn)得出目標圖像每行的貝塞爾曲線(xiàn),組成二維貝塞爾曲面,再將目標圖像數據采用貼紋理的方法擬合到貝塞爾曲線(xiàn)上從而實(shí)現圖像變形。Bezier 曲線(xiàn)是法國雷諾汽車(chē)公司Bezier 提出的一種用控制多邊形定義曲線(xiàn)和曲面的方法。它的擬合插值公式為:

基于CUDA技術(shù)的視頻顯示系統的設計與開(kāi)發(fā)

式中:Pi 為構成該曲線(xiàn)的特征多邊形;Bi,n (t) 是Bezier基函數,是曲線(xiàn)上各點(diǎn)位置矢量的調和函數。Bezier曲線(xiàn)的始點(diǎn)、末點(diǎn)與其特征多邊形端點(diǎn)重合,且始點(diǎn)、末點(diǎn)的切線(xiàn)方向與特征多邊形的第一和最后一條邊一致。

該曲線(xiàn)具有凸包性、對稱(chēng)性等特性。貝塞爾曲線(xiàn)的優(yōu)點(diǎn)是給定足夠的控制點(diǎn)后,它能夠擬合任意形狀的曲線(xiàn)。

Bezier曲線(xiàn)的擬合插值公式中,函數的次數是與特征多邊形的頂點(diǎn)數相應的,當特征多邊形頂點(diǎn)數為4時(shí),就構成三次Bezier 曲線(xiàn)。三次Bezier曲線(xiàn)的擬合插值公式為:

基于CUDA技術(shù)的視頻顯示系統的設計與開(kāi)發(fā)

OPenGL技術(shù)提供了易于操作的貝塞爾曲線(xiàn)生成函數和貼圖函數,但卻無(wú)法控制硬件運算,效率不高。本系統出于對時(shí)效性的考慮在實(shí)現過(guò)程中并未采用該方法,而是采用并行矩陣運算的方式來(lái)進(jìn)行紋理貼圖。根據CUDA 程序的結構特點(diǎn),本系統處理時(shí),首先根據人機交互部分得到的控制點(diǎn)信息采用通常方法生成目標圖像每行的貝塞爾曲線(xiàn)。開(kāi)辟顯存存入GPU,然后對應CUDA 程序結構,針對目標圖像上的每一個(gè)像素點(diǎn),為其分配一個(gè)GPU thread 來(lái)進(jìn)行處理。

觀(guān)察上面的計算公式發(fā)現,當獲得了初始控制點(diǎn)坐標后,在得出每一條貝賽爾曲線(xiàn)上的點(diǎn)的過(guò)程中,彼此并不影響,具有多線(xiàn)程的粗粒度的特性,所以CUDA 并行計算的時(shí)效性有很大的提高。

2 性能評估

在多媒體拼接系統中實(shí)時(shí)性是最基本、也是最重要的指標。我們觀(guān)看到的大屏幕拼接動(dòng)態(tài)效果是由一幀一幀圖片快速顯示而產(chǎn)生的。根據正常的人眼視覺(jué)殘留水平系統要達到顯示流暢的畫(huà)面,1 s 要處理至少25 張圖片,也就是說(shuō)整個(gè)程序一次圖像處理流程不會(huì )超過(guò)40 ms.下面本文將分析一下該系統的時(shí)效性。

由于圖像采集部分和處理部分采用的是異步方式,時(shí)間復用,而顯然處理部分的耗時(shí)又遠遠超過(guò)采集部分,所以只列出處理部分的時(shí)間消耗,又因為該部分效率主要受顯卡GPU 性能影響,所以之對比不同型號GPU 的時(shí)間消耗情況。具體如表1所示。

基于CUDA技術(shù)的視頻顯示系統的設計與開(kāi)發(fā)

由此我們看出采用GeForce8800GT 顯卡可以基本上完成顯示功能,而采用GeForceGTX470則可以每秒鐘顯示35~40張圖片,是用戶(hù)完全感覺(jué)流暢的視頻體驗。

3 結語(yǔ)

今年來(lái)大屏幕對計算機操作演示的需求越來(lái)越多,而高性能顯卡的發(fā)展又促使GPU計算逐漸成為大規模并行計算重要的解決途徑。本系統采用了實(shí)現了視頻拼接系統,目前本系統采用兩個(gè)雙頭顯卡組成顯示功能模塊最多實(shí)現四屏拼接,如果需要更多屏幕拼接顯示時(shí)可以考慮使用網(wǎng)絡(luò )C-S 結構進(jìn)行擴展。由于耗時(shí)的圖像處理部分完全有GPU 進(jìn)行計算,屏幕越多需要計算的內容也隨之增多,而同時(shí)系統顯卡數量也會(huì )增多,所以該系統不會(huì )隨著(zhù)拼接屏幕增多而性能下降。由于系統總體采用并行技術(shù),所以將來(lái)可以方便地為系統加入時(shí)下流行的人機互動(dòng)模塊、真實(shí)感渲染模塊等部分,使之真正成為一款高性能多媒體展示系統,給用戶(hù)一個(gè)全方位真實(shí)的體驗。

全息投影相關(guān)文章:全息投影原理


關(guān)鍵詞: CUDA技術(shù) 視頻顯示

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>