<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 基于GPU的并行Voronoi圖柵格生成算法

基于GPU的并行Voronoi圖柵格生成算法

作者：時(shí)間：2018-08-08 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

Voronoi圖是一種空間分割算法。其是對空間中的n個(gè)離散點(diǎn)而言的，它將平面分割為n個(gè)區域，每個(gè)區域包括一個(gè)點(diǎn)，此區域是到該點(diǎn)距離最近的點(diǎn)的集合。由于Voronoi圖具有最鄰近性，鄰接性等眾多性質(zhì)和完善的理論體系，其被廣泛的應用在地理學(xué)、氣象學(xué)、結晶學(xué)、航天、機器人等領(lǐng)域。

本文引用地址：http://dyxdggzs.com/article/201808/385935.htm

Voronoi圖的生成主要有矢量方法和柵格方法。矢量法中，典型的方法有增量法、分治法和間接法。分治法是一種遞歸方法，算法思路簡(jiǎn)單，但是很難在應用過(guò)程中實(shí)現動(dòng)態(tài)更新。間接法則是根據其對偶圖Delaunay三角網(wǎng)來(lái)構造Voronoi圖，因此其性能的高低由所采用的Delaunay三角網(wǎng)的構造算法所決定。增量法通過(guò)不斷向已生成的Voronoi圖中增加點(diǎn)來(lái)動(dòng)態(tài)構建Voronoi圖。相對于前兩種方法，增量法構造簡(jiǎn)單并且容易實(shí)現動(dòng)態(tài)化，所以被廣泛應用。矢量方法的優(yōu)勢是生成Voronoi圖精度高，但是存在存儲復雜，生長(cháng)元只能是點(diǎn)和線(xiàn)，以及難以向三維及高維空間擴展等問(wèn)題。因此本文重點(diǎn)研究了Voronoi圖的柵格生成方法，首先比較了常見(jiàn)的柵格方法生成Voronoi圖的優(yōu)缺點(diǎn)，然后結合CUDA的出現，提出一種基于GPU的 Voronoi圖并行柵格生成算法。

1 柵格法簡(jiǎn)介

柵格方法生成Voronoi 圖主要是將二值圖像轉化為柵格圖像，然后確定各個(gè)空白柵格歸屬。主要方法有兩類(lèi)，一類(lèi)以空白柵格為中心，計算每個(gè)空白柵格到生長(cháng)目標的距離，以確定其歸屬，常見(jiàn)的方法有代數距離變換法，逐個(gè)空白柵格確定法等;另一類(lèi)以生長(cháng)目標為中心，不斷擴張生長(cháng)目標的距離半徑，填充其中的空白柵格，直到將整個(gè)圖像填充完成，主要有圓擴張法，數學(xué)形態(tài)學(xué)距離變換法等。代數距離變換法對距離圖像進(jìn)行上行掃描(從上到下，從左到右)和下行掃描(從下向上，從右到左)兩次掃描，計算出每個(gè)空白柵格最鄰近的生長(cháng)目標，以此生長(cháng)目標作為其歸屬。此方法中柵格距離的定義直接影響了空白柵格的歸屬和Voronoi圖的生成精度，通常使用的柵格距離定義有街區距離、八角形距離、棋盤(pán)距離等。距離變換的柵格生成方法精度低、耗時(shí)長(cháng)，所需要花費的時(shí)間和柵格的數量成正比，當柵格為n×n大小時(shí)，其時(shí)間復雜度為O(n×n)。圓檢測法以生長(cháng)目標為圓心，以一定的步長(cháng)為初始半徑，所有生長(cháng)目標同時(shí)對其構成的圓內的空白柵格進(jìn)行覆蓋。通過(guò)不斷擴大生長(cháng)目標的半徑，將會(huì )有越來(lái)越多的空白柵格被各個(gè)圓所覆蓋，直到最終覆蓋完整個(gè)圖像。數學(xué)形態(tài)學(xué)距離變換法與圓檢測法類(lèi)似，其思想來(lái)源于數學(xué)形態(tài)學(xué)中膨脹操作，膨脹操作起到了擴大圖像的效果，通過(guò)不斷的對生長(cháng)目標進(jìn)行膨脹操作，最終擴張到所有的空白柵格。這兩種方法有個(gè)共同的缺點(diǎn)，在每次擴張后，都需要判斷整個(gè)柵格圖像是否已完成擴張，而這需要遍歷柵格圖像，十分耗時(shí)。

2 GPU下的柵格生成方法

2.1 CUDA編程模型與GPU

CUDA是一個(gè)并行編程模型和一個(gè)軟件編程環(huán)境，其采用了C語(yǔ)言作為編程語(yǔ)言，提供了大量的高性能計算指令開(kāi)發(fā)能力，使開(kāi)發(fā)者能夠在GPU的強大計算能力上建立起一種更加高效的密集數據計算解決方案。

CUDA將CPU作為主機端，GPU作為設備端，一個(gè)主機端可以有多個(gè)設備端。其采用CPU和GPU協(xié)同工作的方式，CPU主要負責程序中的串行計算的部分，GPU主要負責程序中的并行計算的部分。GPU上運行的代碼被稱(chēng)為內核函數，其能夠被GPU上內置的多個(gè)線(xiàn)程并行執行。一個(gè)完整的任務(wù)處理程序由 CPU端串行處理代碼和GPU端并行內核函數共同構成。當CPU中執行到GPU代碼時(shí)，其首先將相關(guān)數據復制到GPU中，然后調用GPU的內核函數，GPU中多個(gè)線(xiàn)程并行執行此內核函數，當完成計算后，GPU端再把計算的結果返回給CPU，程序繼續執行。通過(guò)將程序中耗時(shí)的且便于并行處理的計算轉移到GPU中使用GPU并行處理，以提高整個(gè)程序的運行速度。CUDA是以線(xiàn)程網(wǎng)格(Grid)，線(xiàn)程塊(Block)，線(xiàn)程(Thread)為三層的組織架構，每一個(gè)網(wǎng)格由多個(gè)線(xiàn)程塊構成，而一個(gè)線(xiàn)程塊又由多個(gè)線(xiàn)程構成，如圖1所示。在GPU中，線(xiàn)程是并行運行的最小單元，由此可見(jiàn)，當存在大量的線(xiàn)程時(shí)，程序的并行程度將會(huì )十分高。目前的GPU上一個(gè)網(wǎng)格最多包含65535×65535個(gè)線(xiàn)程塊，而一個(gè)線(xiàn)程塊通常有512個(gè)或1024個(gè)線(xiàn)程，所以理論上可以對65535×65535×512個(gè)柵格同時(shí)進(jìn)行計算。

2.2 并行Voronoi圖柵格生成算法

傳統的柵格生成算法中，不論是采用以空白柵格為中心確定其歸屬的方法，還是以生長(cháng)目標為中心通過(guò)不斷增長(cháng)生長(cháng)目標半徑對空白柵格進(jìn)行覆蓋的方法，他們在計算每個(gè)空白柵格距離時(shí)，只能通過(guò)遍歷柵格，逐一處理。而柵格處理過(guò)程中的一個(gè)重要特點(diǎn)是，各個(gè)柵格的計算并不依賴(lài)于其他柵格的計算結果。即各個(gè)柵格的計算是相互獨立的，而由于CPU的串行性，導致了各個(gè)柵格只能順序處理，降低了處理速度。

圖1GPU組織架構

由于GPU下的多個(gè)線(xiàn)程都是硬件實(shí)現的，各個(gè)線(xiàn)程的處理都是并行的，因此將柵格距離的計算分散到GPU端各個(gè)線(xiàn)程，必然能夠提高其生成速度。為了并行處理柵格化圖像，可以采用如下的想法，將每一個(gè)柵格點(diǎn)對應于一個(gè)線(xiàn)程，此線(xiàn)程計算此柵格到所有的生長(cháng)目標的距離，取最小距離的生長(cháng)目標作為其歸屬。即采用一個(gè)線(xiàn)程用來(lái)確定一個(gè)空白柵格歸屬的方法。

確定方法后，就需要對GPU端內核函數進(jìn)行設計，由于內核函數是并行處理的執行單元，其設計方式直接決定了GPU端的程序運行效率。因此如何設計良好的內核函數是提高并行速度的關(guān)鍵。本文采用如下方式進(jìn)行內核函數的設計，假設共分配了K個(gè)并行處理線(xiàn)程，柵格規模為M×N，設A[i]為第i個(gè)線(xiàn)程處理的柵格編號。當K

由于顯卡上的內存是動(dòng)態(tài)隨機存儲(DRAM)，因此最有效率的存取方式，是以連續的方式存取。當采用第一種方式時(shí)，看似是一種連續的存取方式，實(shí)際上恰好是非連續的，當第i個(gè)線(xiàn)程處理第i個(gè)柵格時(shí)，由于處理需要一定的時(shí)間，此時(shí)GPU自動(dòng)將下個(gè)一線(xiàn)程i+1需要的內存數據取出給其使用，此時(shí)下一個(gè)線(xiàn)程的內存數據卻是在i+C處，內存變成了間斷存取。而在使用第二種方式進(jìn)行處理時(shí)，恰好是一種連續的存取方式，由于第i個(gè)線(xiàn)程正在處理第i個(gè)柵格數據，此時(shí) GPU為第i+1個(gè)線(xiàn)程準備數據，而此時(shí)的數據正好為第i+1內存處。滿(mǎn)足了內存的連續存取特性。因此本文采用第二種方式，內核函數的設計偽代碼如下：

上一頁(yè) 1 2 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： GPU 并行Voronoi 圖柵格

評論

相關(guān)推薦

這顆芯片有故事，你有酒嗎？

FPGAwuhan | 2016-08-20

Intel 收購 NVDIA 意欲何為

視頻 Intel NVDIA CPU GPU 移動(dòng)處理 | 2012-12-26

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

獲得GPU存儲性能的四種方法

資源下載 GPU 存儲 | 2020-04-01

中國科學(xué)院院士：CPU、GPU架構上國人沒(méi)貢獻很遺憾應加強創(chuàng )新

嵌入式系統 CPU GPU 架構 | 2024-07-12

GPU和CPU芯片誰(shuí)更復雜?

睡夢(mèng)中的雄師 | 2023-08-24

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

目標完全替代閉源驅動(dòng)，英偉達宣布全面轉向開(kāi)源 GPU 內核模塊

嵌入式系統閉源驅動(dòng) 英偉達開(kāi)源 GPU 內核模塊 Linux | 2024-07-22

GPU圖形處理器各大廠(chǎng)家芯片參數介紹

資源下載 GPU 芯片 | 2013-08-30

gpu_gpu是什么意思

dolphin | 2014-06-12

APU與GPU共進(jìn) AMD搶攻嵌入式應用

設計方案 APU GPU AMD | 2015-08-19

CPU與GPU：誰(shuí)將主導下一次計算革命？

資源下載 CPU GPU 計算革命融合集成 SOC | 2008-05-26

醫療電子平臺選擇:FPGA、ARM、X86、DSP還是GPU分析

設計方案 FPGA ARM DSP GPU X | 2015-08-13

消息稱(chēng)臺積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

談GPU的作用、原理及與CPU、DSP的區別

設計方案 GPU CPU DSP 緩存體系 3 | 2015-08-13

Imagination：我們的移動(dòng)GPU技術(shù)一騎絕塵

設計方案 Imagination TI GPU | 2015-08-19

LabVIEW和GPU用于實(shí)時(shí)高性能運算系統

資源下載 NI LabVIEW GPU | 2013-03-29

消息稱(chēng)英偉達 RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應緊張

消費電子英偉達 GPU | 2024-07-29

打破NVIDIA壟斷！英國公司實(shí)現CUDA軟件在A(yíng)MD GPU上無(wú)縫運行

智能計算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

Manpower代招上海 US MNC GPU Physical design technical leader

魔都獵頭招聘 | 2013-07-23

大嘴業(yè)話(huà)：A12真的能改變競爭格局么？

視頻 ARM A12 GPU | 2013-06-21

基于視覺(jué)的駕駛員輔助嵌入式系統(下)

資源下載 ADAS 嵌入式 GPU | 2014-03-28

基于GPU的數字圖像并行處理研究

設計方案圖像處理算法并行流處理 GPU | 2015-08-13

《E點(diǎn)冷知識》：引發(fā)AI行業(yè)大地震的CUDA究竟有多強大

視頻英偉達 GPU CUDA AI | 2024-03-26

Meta訓練Llama 3遭遇頻繁故障

智能計算 Meta Llama 3 英偉達 H100 顯卡 GPU | 2024-07-29

消息稱(chēng)英偉達曾向臺積電詢(xún)問(wèn)建設廠(chǎng)外 CoWoS 先進(jìn)封裝專(zhuān)線(xiàn)可能，遭拒絕

EDA/PCB 英偉達 GPU 封裝工藝臺積電 | 2024-07-23

RISC-V為開(kāi)源GPU鋪平道路

風(fēng)的印記 | 2021-08-16

GPU的形態(tài)已徹底改變，英偉達GTC大會(huì )發(fā)布的到底是什么

視頻英偉達 GPU Blackwell AI GTC | 2024-03-26

什么是 DLSS，值得嗎？

智能計算 DLSS gpu NVIDIA | 2024-07-17

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>