<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 手機與無(wú)線(xiàn)通信 > 設計應用 > 基于GPU的AES算法實(shí)現

基于GPU的AES算法實(shí)現

作者：時(shí)間：2011-06-14 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

GPU和內存的數據交換是一筆很大的開(kāi)銷(xiāo)，因此從整體上減小這部分的開(kāi)銷(xiāo)是優(yōu)化的關(guān)鍵。從GPU執行的特點(diǎn)來(lái)看，每個(gè)線(xiàn)程都獨自從內存中讀取一個(gè)分組長(cháng)度的數據塊，加密完成后寫(xiě)回到內存中。這樣，每加密一個(gè)分組長(cháng)度都要讀寫(xiě)一次內存，整體IO效率低。根據程序的局部性原理，如果一次讀入相鄰的多個(gè)分組，IO效率會(huì )大大提高。在前面的GPU程序中，我們是在一個(gè)線(xiàn)程里加密一個(gè)分組?，F在我們一次讀取多個(gè)分組進(jìn)行加密。這樣從整體上提高了IO效率。鑒于線(xiàn)程處理器還可以進(jìn)行并行操作，我們還可以使用流數據類(lèi)型，進(jìn)一步提高并行度。
改進(jìn)的算法如下：
brook：：Streamint>*datastream；
datastream．read(Block[m][n])；
AESEncrypt_CPU_Simple(dtatastream)；
Datastream．write(Block[m][n])；
改進(jìn)后，每個(gè)線(xiàn)程一次讀取n個(gè)相鄰的分組進(jìn)行加密。

4 實(shí)驗設計
實(shí)驗采用的CPU是GeForce 9800 GTX+，軟件使用GUDA2．1，是在WmdowsXP操作系統下運行的。
CPU對AES算法的加速結果如圖1所示。從圖中可以看出，當數據量較小時(shí)(小于100kB)，GPU上的運行性能要低于CPU，這是因為GPU的特點(diǎn)是適合用作高密度數據的并行計算，而當數據量較小時(shí)并無(wú)法充分利用到GPU的計算資源，而且從主機向設備傳輸輸入數據和由設備向主機返回數據又會(huì )占用一定的開(kāi)銷(xiāo)，因此對于小數據量的處理并不適合使用GPU。隨著(zhù)數據量的增加，GPU運算的性能就會(huì )明顯高于CPU。當數據量大于1MB時(shí)，GPU具有將近兩倍的加速倍數，之后加速倍數就基本穩定下來(lái)，達到飽和，這是因為當數據量已經(jīng)足夠多，充分利用了GPU的計算資源。由于GPU的計算能力遠遠高于它訪(fǎng)問(wèn)設備內存的帶寬以及主機與設備之間的數據傳輸帶寬，在應用中這些數據傳輸的開(kāi)銷(xiāo)會(huì )成為限制GPU運算整體性能的瓶頸，需要對GPU進(jìn)行優(yōu)化，才能充分開(kāi)發(fā)出GPU的計算優(yōu)勢。
圖1 GPU對AES算法的加速效果

本文引用地址：http://dyxdggzs.com/article/156187.htm

對實(shí)驗結果進(jìn)行優(yōu)化。通過(guò)優(yōu)化，可以提高超過(guò)兩倍的加速效果，在數據量大時(shí)，優(yōu)化結果更為明顯，如圖2所示。

5 結論
本文介紹了在GPU上實(shí)現AES加密算法的方法。首先介紹了AES算法，然后對CUDA中的GPU結構和CUDA編程模型進(jìn)行了深入的研究。最后在GPU和CPU平臺上對設計進(jìn)行了實(shí)驗對比，取得了理想的加速效果。其實(shí)在大多數應用情況下，目前計算機顯卡配置的GPU運算潛能并沒(méi)有完全釋放出來(lái)，本文介紹的加密方法是GPU通用計算具體應用的一個(gè)體現。雖然目前以CUDA為代表的GPU仍然存在精度不高，程序編寫(xiě)限制較多的缺點(diǎn)，但隨著(zhù)并行流處理概念的進(jìn)一步發(fā)展，GPU通用計算技術(shù)將在各個(gè)領(lǐng)域發(fā)揮更大的作用。

上一頁(yè) 1 2 3 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 實(shí)現 算法 AES GPU 基于

評論

相關(guān)推薦

基于VxWorks的多DSP系統的多任務(wù)程序設計(老站轉)

amine | 2002-05-28

SHIPT算法擠壓了外包工人如何對雇主進(jìn)行審計

智能計算 SHIPT 算法算法管理 | 2024-07-04

大嘴業(yè)話(huà)：A12真的能改變競爭格局么？

視頻 ARM A12 GPU | 2013-06-21

vxworks下bsp制作教程(老站轉)

amine | 2002-05-28

基于MSP430F133的電子鎮流器綜合測試儀

設計方案基于 MSP430F133 電子鎮流器綜合測試儀 | 2009-07-06

仿真器概念及實(shí)現技術(shù)

jackwang | 2002-05-14

PID算法

資源下載 PID 算法誤差 | 2007-02-16

GPU的形態(tài)已徹底改變，英偉達GTC大會(huì )發(fā)布的到底是什么

視頻英偉達 GPU Blackwell AI GTC | 2024-03-26

消息稱(chēng)臺積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

打破NVIDIA壟斷！英國公司實(shí)現CUDA軟件在A(yíng)MD GPU上無(wú)縫運行

智能計算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

《E點(diǎn)冷知識》：引發(fā)AI行業(yè)大地震的CUDA究竟有多強大

視頻英偉達 GPU CUDA AI | 2024-03-26

基于運放的差動(dòng)放大器

設計方案基于運放差動(dòng) 放大器 | 2009-07-06

利用PIC12C508單片機來(lái)實(shí)現加密狗技術(shù)[轉帖]

hpnet | 2002-05-19

模擬電路PWM的實(shí)現

設計方案模擬電路實(shí)現 | 2009-07-06

Intel 收購 NVDIA 意欲何為

視頻 Intel NVDIA CPU GPU 移動(dòng)處理 | 2012-12-26

[轉帖]us/os就緒表的維護算法分析

amine | 2002-05-17

消息稱(chēng)英偉達曾向臺積電詢(xún)問(wèn)建設廠(chǎng)外 CoWoS 先進(jìn)封裝專(zhuān)線(xiàn)可能，遭拒絕

EDA/PCB 英偉達 GPU 封裝工藝臺積電 | 2024-07-23

嵌入式開(kāi)發(fā)者都該了解的十大算法

嵌入式開(kāi)發(fā)者算法 | 2024-07-16

數字PID控制算法之一

資源下載 PID PID控制算法 | 2007-12-28

FOPLP導入AI GPU 估2027年量產(chǎn)

EDA/PCB FOPLP AI GPU 臺積電 | 2024-07-04

中國科學(xué)院院士：CPU、GPU架構上國人沒(méi)貢獻很遺憾應加強創(chuàng )新

嵌入式系統 CPU GPU 架構 | 2024-07-12

加密算法之MD5算法

資源下載加密算法加密算法 MD5算法 | 2007-02-16

基于RC電路的一次性濾波器

設計方案基于電路一次性濾波器 | 2009-07-06

什么是 DLSS，值得嗎？

智能計算 DLSS gpu NVIDIA | 2024-07-17

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

CRC算法原理及C語(yǔ)言實(shí)現

資源下載 CRC 算法 C語(yǔ)言 | 2007-02-16

基于D類(lèi)功放專(zhuān)用驅動(dòng)芯片驅動(dòng)的高保真純正弦波逆變器1

設計方案基于功放專(zhuān)用驅動(dòng) 芯片高保真正弦波逆變器 | 2009-07-06

簡(jiǎn)單實(shí)用的單片機CRC 快速算法

資源下載 CRC 算法單片機 | 2007-02-16

目標完全替代閉源驅動(dòng)，英偉達宣布全面轉向開(kāi)源 GPU 內核模塊

嵌入式系統閉源驅動(dòng) 英偉達開(kāi)源 GPU 內核模塊 Linux | 2024-07-22

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>