<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 如何用C語(yǔ)言描述AES256加密算法最高效？

如何用C語(yǔ)言描述AES256加密算法最高效？

作者：時(shí)間：2017-06-03 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

用C 語(yǔ)言描述AES256 加密算法，然后在硬件中加速性能。

本文引用地址：http://dyxdggzs.com/article/201706/346833.htm

高級加密標準 (AES) 已經(jīng)成為很多應用（諸如嵌入式系統中的應用等）中日漸流行的密碼規范。自從 2002 年美國國家標準技術(shù)研究所 (NIST) 將此規范選為標準規范以來(lái)，處理器、微控制器、FPGA和 SoC 應用的開(kāi)發(fā)人員就開(kāi)始利用 AES 來(lái)保護輸入、輸出及保存在系統中的數據。我們可在更高抽象層上非常高效地描述算法，就像用于傳統軟件開(kāi)發(fā)中那樣；但由于涉及到的操作，該算法在 FPGA中實(shí)現起來(lái)最為高效。開(kāi)發(fā)人員甚至可在布線(xiàn)中“免費”獲得一些操作。

基于這些原因，AES 是個(gè)絕佳的例子，即開(kāi)發(fā)人員可利用 C 語(yǔ)言描述算法，然后在硬件中加速實(shí)現，從而受益于賽靈思 SDSoC ? 開(kāi)發(fā)環(huán)境。本文中我們就是要這樣做，首先熟悉一下 AES 算法，然后在賽靈思 Zynq?-7000 All Programmable SoC 的處理系統 (PS) 上實(shí)現 AES256（256 位秘鑰長(cháng)度）以建立軟件性能基準，然后再在片上可編程邏輯 (PL)中進(jìn)行加速。為了完全了解可獲得的優(yōu)勢，我們將在 SDSoC 環(huán)境所支持的全部三個(gè)操作系統中執行這幾個(gè)步驟，三個(gè)操作系統為：Linux、FreeRTOS 和裸機。

算法
AES 屬于對稱(chēng)塊密碼，可采用 128、192 和 256位不同的秘鑰長(cháng)度。秘鑰長(cháng)度決定加密或解密數據所需的處理步驟數。顧名思義，塊密碼算法采用的是數據塊。AES 算法一次處理 16 字節的固定模塊。因此，如果我們密碼內容少于 16 字節，就必須將未使用的字節進(jìn)行填充。

由于 AES 是對稱(chēng)密碼，信息加密和解密都采用相同的做法和秘鑰。相反，非對稱(chēng)算法（例如RSA）則使用不同秘鑰進(jìn)行數據加密和解密。

AES 算法中四個(gè)階段中每個(gè)階段都代表一個(gè)狀態(tài)。四個(gè) AES 階段的組合稱(chēng)為一個(gè)循環(huán)。所需循環(huán)的數量取決于秘鑰長(cháng)度。

很簡(jiǎn)單，AES 狀態(tài)起始于我們要加密的 16 個(gè)字節。每個(gè)新步驟都會(huì )對狀態(tài)進(jìn)行更新。處理狀態(tài)之前，我們需要將輸入字節串變?yōu)槌跏紶顟B(tài)，即 4 x 4矩陣（圖 1）。

圖 1 — 16 字節的初始狀態(tài)轉換為 4 x 4 矩陣

現在，我們將最初的 16 個(gè)字節重新編排為 4 x4 矩陣形式的初始狀態(tài)，便可研究每個(gè)步驟如何操縱它的輸入狀態(tài)。

輪密鑰加(AddRoundKey) ：這是唯一使用加密秘鑰的步驟。我們已經(jīng)注意到，所需的加密算法循環(huán)的數量取決于秘鑰長(cháng)度（128、192 或 256 位）。必須對加密秘鑰進(jìn)行秘鑰擴展，以確保在每個(gè)循環(huán)中不會(huì )重新使用秘鑰中的字節。果然，對于不同的秘鑰長(cháng)度而言擴展秘鑰長(cháng)度并不相同。擴展秘鑰長(cháng)度為：
擴展秘鑰長(cháng)度（字節）= 16 *（循環(huán) + 1）

這個(gè)步驟中的操作很簡(jiǎn)單。輸入狀態(tài)字節與擴展秘鑰的 16 個(gè)字節進(jìn)行異或運算。每個(gè)循環(huán)使用擴展秘鑰的不同部分；循環(huán) 0 使用字節 0 至 15，循環(huán)1 使用字節 16 至 31，以此類(lèi)推。對于每個(gè)循環(huán)，狀態(tài)的字節 1 與擴展秘鑰的最低有效字節進(jìn)行異或運算，字節 2 與“最低有效字節+1”進(jìn)行異或運算，以此類(lèi)推。

字節替換 (SubBytes) ：該步驟利用字節替換將狀態(tài)值用另一個(gè)值替換出去。替換盒中的值是預先設定的，而且輸入位于輸出位之間的關(guān)聯(lián)較小。替換盒 (S-box) 是一個(gè) 16 x 16 矩陣。我們使用被替代字節的高四位和低四位作為替代表格中的索引。例如，使用圖 2 中的 S-box 加密，如果第一個(gè)初始狀態(tài)字節為 0 x 69，那么用替代值 0 x F9 代替。狀態(tài)字節的高四位選擇替代表格的行；低四位選擇列。注意在圖 2 中，加密和解密使用不同的替換盒，而且盒中內容不同。

圖 2 — AES S-box 內容

行位移變換 (ShiftRows) ：該步驟對每行執行循環(huán)字節移位，以重新排列輸入狀態(tài)矩陣。我們將每行右旋不同個(gè)因數（圖 3）。第 1 行不變。將第 2 行移動(dòng) 1 個(gè)字節，第 3 行移動(dòng) 2 個(gè)字節，第 4 行移動(dòng)3 個(gè)字節。解密時(shí)執行相同操作，但向左旋轉而非向右。

圖 3 — 行位移變換 (ShiftRows) 操作

列混合變換 (MixColumns) ：這是循環(huán)中最復雜的步驟，需要進(jìn)行 16 次乘法和 12 次異或運算。逐列對輸入狀態(tài)矩陣進(jìn)行此操作，將輸入狀態(tài)矩陣與固定矩陣相乘以獲得新的狀態(tài)列（圖 4）。列中的每項與矩陣中的一行相乘。將每次乘法結果進(jìn)行異或運算，以獲得新的狀態(tài)值。第一個(gè)要進(jìn)行相乘運算的列和行在圖 4 中加亮顯示。

圖 4 — 用于加密和解密的列混合變換 (MixColumns) 函數

以下是第一列的列混合變換(MixColumns) 方程：
B1’ = (B1 * 2) XOR (B2 * 3) XOR (B3 * 1) XOR (B4 * 1)
B2’ = (B1 * 1) XOR (B2 * 2) XOR (B3 * 3) XOR (B4 * 1)
B3’ = (B1 * 1) XOR (B2 * 1) XOR (B3 * 2) XOR (B4 * 3)
B4’ = (B1 * 3) XOR (B2 * 1) XOR (B3 * 1) XOR (B4 * 2)

然后，為輸入狀態(tài)中的下一個(gè)列采用相同乘法矩陣重復這個(gè)過(guò)程，直到處理完所有輸入狀態(tài)列。

既然我們已經(jīng)理解了 AES 加密和解密算法所需的詳細步驟，那么還需要知道一個(gè)循環(huán)中這些步驟的應用順序以及我們是否必須為每個(gè)循環(huán)應用所有步驟。每個(gè) AES 加密循環(huán)都包含全部四個(gè)步驟，并按照以下順序：
1. 字節替換 (SubBytes) ;
2. 行位移變換 (ShiftRows);
3. 列混合變換 (MixColumns) （只針對循環(huán) 1 至N–1）;
4. 輪密鑰加 (AddRoundKey)（使用擴展秘鑰）。

當然，我們需要能夠反轉這個(gè)過(guò)程，將不可讀的密文變回純文本，讓加密信息有用。為此，我們將步驟進(jìn)行如下排序：
1. 反轉行位移變換；
2. 反轉字節替換；
3. 輪密鑰加（使用擴展秘鑰）;
4. 反轉列混合變換（只針對循環(huán) 1 至 N–1）。
執行第一輪加密之前，我們需要為加密和解密執行初始輪密鑰加 (AddRoundKey) 操作。

可在更高抽象層上高效地描述 AES，就像在傳統軟件開(kāi)發(fā)中那樣，但在 FPGA 中實(shí)現起來(lái)最為高效。開(kāi)發(fā)人員甚至可在布線(xiàn)中“免費”獲得一些操作。

我們看一下擴展秘鑰必須使用的算法，以便提供足夠的秘鑰位，用以執行相應數量的輪密鑰加(AddRoundKey) 步驟（圖 5）。進(jìn)行秘鑰擴展時(shí)，16、24 或 32 字節的秘鑰長(cháng)度分別需要 44、52 或 60個(gè)循環(huán)。擴展秘鑰的第一個(gè)字節等于初始秘鑰。這意味著(zhù)對于我們的 AES256 實(shí)例來(lái)說(shuō)，擴展秘鑰的最開(kāi)始的 32 個(gè)字節就是秘鑰本身。秘鑰擴展操作在每次迭代中為擴展秘鑰生成 32 個(gè)附加位。

圖 5 — 秘鑰擴展算法

擴展秘鑰的第一個(gè)字節等于初始秘鑰。這意味著(zhù)對于我們的 AES256 實(shí)例來(lái)說(shuō)，擴展秘鑰的最開(kāi)始的 32 個(gè)字節就是秘鑰本身。

以下是重要的擴展步驟：
RotateWord: 與行位移變換 (ShiftRows) 類(lèi)似，這個(gè)步驟重新組織 32 位字，以使最高有效字節變?yōu)樽畹陀行ё止潯?br />SubWord: 這個(gè)步驟使用的替換盒與加密時(shí)進(jìn)行字節替換所使用的替換盒相同。
rcon: 該階段對用戶(hù)定義的值進(jìn)行 2 次冪運算。
與列混合變換 (MixColumns) 階段類(lèi)似，rcon 也在有限域 (28) 中執行；因此這個(gè)步驟普遍使用預先計算的查找表。
EK: 從擴展秘鑰返回 4 個(gè)字節。
K: 與 EK 類(lèi)似，從秘鑰返回 4 個(gè)字節。
如何知道我們已經(jīng)正確實(shí)現了加密和秘鑰擴展算法？ AES 的 NIST 規范包含多個(gè)有效實(shí)例，可用來(lái)檢查我們自己的實(shí)現結果。

創(chuàng )建代碼
為了確保能夠加速 Zynq SoC 的 PL 中 AES 代碼的加密部分，我們必須一開(kāi)始就要以這個(gè)目標來(lái)開(kāi)發(fā)代碼（見(jiàn)這里的編碼規則）。要考慮的第一件事是算法的架構；我們需要正確對其進(jìn)行分段。AES 很適合這種方案，因為我們可以為每個(gè)階段編寫(xiě)函數，然后再根據需要調用。我們還必須編寫(xiě)要在自身的文件中進(jìn)行加速的函數。軟件架構包括以下內容。

main.c: 該文件包含秘鑰擴展算法、加密秘鑰和純文本輸入，以及對 AES 加密函數的調用。

aes_enc.c: 該文件執行加密。我們將每個(gè)階段編寫(xiě)為單獨的函數，這樣就能根據 AES 循環(huán)的需要進(jìn)行調用。為確保程序設計對于處理器上執行的程序具有通用性，我們?yōu)榛旌喜襟E的乘法使用查找表。

aes_enc.h: 這個(gè)文件包含 aes_funcTIon 的定義以及用來(lái)確定大小的參數（例如 mk、nb 和 nr）。

sbox.h: 這個(gè)文件包含用于替換字節的替換盒、執行秘鑰擴展的 rcon 函數的查找表以及用于列混合變換乘法的乘法查找表。

在這個(gè)結構中，我們可以選擇 AES 加密函數( 圖 6) 作為要進(jìn)行加速的函數，只需右鍵點(diǎn)擊該函數并選擇“ Toggle HW/SW”即可。

圖 6 — 要加速的函數

為了能確定基準性能以及通過(guò)函數加速獲得的保存結果，我們必須對函數的執行進(jìn)行時(shí)間控制。為此，我們使用 sds_lib.h 中的sds_clock_counter。

編寫(xiě)源代碼（在 github 提供）之后，在用 ZynqSoC 中的單個(gè) ARM? Cortex ? -A9 處理器內核在軟件中執行 AES 算法時(shí)，我記錄了 36,662 個(gè)處理器周期。

為加速而進(jìn)行的優(yōu)化
加速 AES 算法比前一個(gè)問(wèn)題中的矩陣乘法算法還要稍稍復雜一些。這是因為 AES 算法的主循環(huán)包含互相依賴(lài)的階段。

我加速 AES 算法時(shí)所采用的方法是：檢查循環(huán)以找出可以展開(kāi)的地方；優(yōu)化存儲器帶寬；選擇正確的數據移動(dòng)時(shí)鐘頻率和硬件功能頻率。

AES 加密函數的主循環(huán)包含用于執行每個(gè) AES步驟的函數。AES 算法中的每個(gè)函數必須完整執行，并在下個(gè)函數運行之前計算出結果。這種互相依賴(lài)性需要我們將精力集中于作為獨立函數的 AES步驟。這些步驟中存在足夠多的優(yōu)化潛力。

我們可將輪密鑰加 (AddRoundKey) 、字節替換(SubBytes) 和列混合變換 (MixColumns) 步驟流水線(xiàn)化，以提高性能。在這些函數中，我們通過(guò)將編譯指示放在第一個(gè)循環(huán)中來(lái)執行 HLS Pipeline 命令。我們應展開(kāi)內部循環(huán)。這些函數中有幾個(gè)函數從查找表（通常從 block RAM 構建）讀取數據。我們需要增加存儲器帶寬，在本例中，我將編譯指示參數指定為“完成”，這樣可將存儲器內容實(shí)現為分立寄存器而非BRAM。

在 Zynq SoC 上的 PS 與 PL 之間傳輸數據的能力對提升性能而言也非常重要。我所做的第一步是將數據移動(dòng)時(shí)鐘網(wǎng)絡(luò )設定為最高時(shí)鐘頻率：200MHz。第二個(gè)方案是確保為 PS 與 PL 之間的數據傳輸使用直接存儲器訪(fǎng)問(wèn)。為此，我必須將接口稍加修改，并使用 sds_alloc 函數按照 DMA 傳輸的要求確保數據在存儲器中的連續性（圖 7）。

圖 7 — PS 與 PL 之間的數據移動(dòng)網(wǎng)絡(luò )

第二個(gè)也是最后的優(yōu)化步驟是將硬件功能的時(shí)鐘速率設定在所支持的最高頻率：166.67 MHz。

操作系統支持
當我最終將所有內容放在一起并構建出這個(gè)實(shí)例時(shí)，經(jīng) PL 加速的 AES 代碼在 Linux 上運行16,544 個(gè)處理器時(shí)鐘周期；當在單獨在軟件中運行
AES 代碼時(shí)，只需要 45%(16,544/36,662) 的周期數量。這可將這個(gè)具有互相依賴(lài)關(guān)系且相當復雜的算法的執行時(shí)間縮短 55%。

當然，我們也可在 SDSoC 環(huán)境中選擇 BareMetal或 FreeRTOS 操作系統。創(chuàng )建 BareMetal 和 FreeRTOS項目并重新使用代碼能夠在三種操作系統之間進(jìn)行性能對比。對于給定項目而言，操作系統的選擇取決于任務(wù)要求、性能預算以及響應時(shí)間。

圖 8 給出了 Zynq SoC 的 PS 和 PL 中三種操作系統的性能( 圖 8)。

圖 8 — Zynq PS 和 PL 中的操作系統性能。FreeRTOS 和 BareMetal 提供類(lèi)似的縮短效果。

不出意料，FreeRTOS 和 BareMetal 實(shí)現了類(lèi)似的時(shí)間縮短效果，因為兩種操作系統都比完整的 LinuxOS 簡(jiǎn)單得多。

正如我們的結果所示，利用 SDSoC 開(kāi)發(fā)環(huán)境加速 AES 加密，能實(shí)現真正的性能提升，而且易于實(shí)現—— 無(wú)需深入的 FPGA 設計經(jīng)驗。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： ASIC AES FPGA 嵌入式

評論

相關(guān)推薦

IC設計倚重IP、ASIC趨勢成形

EDA/PCB IC設計 IP ASIC | 2024-06-25

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗小結

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗 | 2007-12-13

嵌入式操作系統大比拼

jackwang | 2002-05-13

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統萊迪思 FPGA 小型FPGA | 2024-07-23

LCD驅動(dòng)器SD0432與嵌入式系統的接口設計

設計方案驅動(dòng)器 SD0432 嵌入式系統接口設計 | 2009-10-10

華清遠見(jiàn)嵌入式在線(xiàn)視頻教程——3、嵌入式Linux開(kāi)發(fā)應用介紹

視頻華清遠見(jiàn) 嵌入式 | 2008-07-09

ASIC邏輯綜合中對關(guān)鍵路徑處理方法的研究

資源下載同濟大學(xué)微電子中心 ASIC 關(guān)鍵路徑處理 | 2007-12-13

2024 CCF嵌入式技術(shù)生態(tài)與產(chǎn)業(yè)發(fā)展論壇(CCF ETIF 2024)邀請函

嵌入式系統 CCF 嵌入式 | 2024-07-16

嵌入式開(kāi)發(fā)者都該了解的十大算法

嵌入式開(kāi)發(fā)者算法 | 2024-07-16

利用強大的軟件設計工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統軟件設計工具 FPGA 萊迪思 | 2024-07-17

華清遠見(jiàn)嵌入式在線(xiàn)視頻教程——2、嵌入式系統的選擇與開(kāi)發(fā)

視頻華清遠見(jiàn) 嵌入式 | 2008-07-09

采用創(chuàng )新的FPGA 器件來(lái)實(shí)現更經(jīng)濟且更高能效的大模型推理解決方案

嵌入式系統 Achronix FPGA | 2024-06-18

大家在互相借鑒吧!--嵌入式系統詞匯表

jackwang | 2002-05-14

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進(jìn)的加密敏捷性和硬件可信根

嵌入式系統萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

LAN91C111型控制器在嵌入式以太網(wǎng)接口中的應用

設計方案 LAN91C111 控制器嵌入式以太網(wǎng) 接口中的應用 | 2009-10-10

華清遠見(jiàn)嵌入式在線(xiàn)視頻教程——4、基于A(yíng)RM的嵌入式開(kāi)發(fā)

視頻華清遠見(jiàn) 嵌入式 | 2008-07-14

Altera公司cyclone系列FPGA-1C6電路圖

設計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

大家在互相借鑒吧!--嵌入式系統詞匯表

jackwang | 2002-05-14

非英偉達聯(lián)盟崛起 ASIC廠(chǎng)吃香

智能計算英偉達 ASIC GPU AI模型訓練 | 2024-07-03

華清遠見(jiàn)嵌入式在線(xiàn)視頻教程——1、走近嵌入式系統

視頻華清遠見(jiàn) 嵌入式 | 2008-07-08

大家在互相借鑒吧!--嵌入式系統詞匯表

jackwang | 2002-05-14

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

嵌入式系統的實(shí)時(shí)數據接口擴展

設計方案嵌入式系統實(shí)時(shí) 數據接口擴展 | 2009-09-28

2024上海嵌入式展如何？夠垂直！

嵌入式系統嵌入式江波龍凌華 Lattice 鼎陽(yáng)科技貿澤電子 IAR 樹(shù)莓派普源精電易靈思 | 2024-06-14

STM32的結構解析STM32的結構解析

嵌入式系統嵌入式 STM32 | 2024-06-26

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

大家在互相借鑒吧!--嵌入式系統詞匯表

jackwang | 2002-05-14

3-DES算法的FPGA高速實(shí)現(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

嵌入式U盤(pán)讀寫(xiě)器接口技術(shù)和系統設計

設計方案嵌入式讀寫(xiě)器接口技術(shù) 系統設計 | 2009-09-29

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>