0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用FPGA實現(xiàn)AES算法的優(yōu)化設(shè)計

電子設(shè)計 ? 來源:郭婷 ? 作者:電子設(shè)計 ? 2019-04-18 08:15 ? 次閱讀

信息安全是計算機(jī)科學(xué)技術(shù)的熱點研究領(lǐng)域,數(shù)據(jù)加密則是信息安全的重要手段。隨著可編程技術(shù)的飛速發(fā)展及高速集成電路的不斷出現(xiàn),采用FPGA實現(xiàn)加密算法已受到越來越廣泛的關(guān)注和重視。與傳統(tǒng)的軟件加密方法相比,硬件加密的優(yōu)點是:(1)安全性好,不易被攻擊;(2)計算速度快,效率高;(3)成本低,性能可靠。加密系統(tǒng)中體現(xiàn)數(shù)據(jù)傳輸速度的一個重要性能指標(biāo)是數(shù)據(jù)吞吐量,計算公式為:(數(shù)據(jù)長度M/時鐘個數(shù)N)×?xí)r鐘頻率F。提高數(shù)據(jù)吞吐量是改善加密系統(tǒng)性能的關(guān)鍵,也是加密算法硬件實現(xiàn)技術(shù)的重要內(nèi)容。

AES算法作為DES算法的替代者應(yīng)用非常廣泛,其硬件實現(xiàn)方法已有不少討論,主要是通過提高算法頻率來提高吞吐量。但是在實際運行中,為了保證整個加密系統(tǒng)的穩(wěn)定性,通常全局時鐘頻率較低,不可能達(dá)到算法的仿真頻率,如PCI接口電路時鐘頻率只有33MHz,因此實際數(shù)據(jù)吞吐量仍然較低。本文根據(jù)AES算法的結(jié)構(gòu)特點及硬件系統(tǒng)的特點,提出一種快速的AES算法IP核設(shè)計方法。該方法采用優(yōu)化設(shè)計輪函數(shù)和流水線技術(shù),在較低的系統(tǒng)時鐘頻率下,通過減少分組運算時鐘數(shù)目來獲得更高的吞吐量和更快的傳輸速度。

1 AES算法

AES是美國國家標(biāo)準(zhǔn)與技術(shù)研究所(NIST)提出的高級加密標(biāo)準(zhǔn)。2000年10月,NIST宣布將比利時人Joan Daemen和Vicent Rijinen提交的Rijndael算法作為高級加密標(biāo)準(zhǔn)(AES)。該算法設(shè)計簡單,與公鑰密碼算法不同,沒有復(fù)雜的乘法運算,易于實現(xiàn),靈活性強(qiáng),輪函數(shù)良好的并行特性有利于硬件設(shè)計與實現(xiàn)。AES算法是一種迭代型分組密碼,其分組長度和密鑰長度均可變,各自可以獨立指定為128bit、192bit、256bit。本文主要討論分組長度和密鑰長度為128bit的情況。

AES算法是將輸入的明文(或密文)分成16個字節(jié),在第一個Add Round Keys變換后進(jìn)入10輪迭代。前9輪完全相同,依次經(jīng)過字節(jié)代替(Substitute Bytes)、行移位(Shift Rows)、列混合(Mix Columns)、輪密鑰加(Add Round Keys),最后一輪則跳過了Mix Column。解密過程與加密過程類似,但執(zhí)行順序與描述內(nèi)容有所不同,因此AES算法的加解密過程需要分別實現(xiàn)。圖1給出了AES算法的加解密過程。

2 AES算法優(yōu)化設(shè)計

2.1 硬件選擇

Cyclone器件是Altera公司推出的成本最低的SRAM工藝FPGA,容量為2 910~20 060個邏輯單元(LE)和多達(dá)288kbit的M4K memory block。每個LE都有一個四輸入的LUT查找表、可編程寄存器和具有進(jìn)位選擇能力的進(jìn)位鏈,可實現(xiàn)任何四輸入變量的函數(shù),能夠進(jìn)行大量邏輯運算,非常適合作為加密算法的硬件載體。設(shè)計中所使用的開發(fā)工具是QuartusII4.2,F(xiàn)PGA芯片選擇Cyclone器件的EP1C12Q240C8,基于Verilog HDL語言實現(xiàn)。

2.2 密鑰擴(kuò)展單元優(yōu)化設(shè)計

密鑰擴(kuò)展是將初始密鑰作為種子密鑰,經(jīng)過字節(jié)代換、字節(jié)移位、輪常數(shù)計算、字異或等過程,計算產(chǎn)生10輪迭代子密鑰。有文獻(xiàn)提出計算密鑰時密鑰擴(kuò)展和加密過程同步執(zhí)行,這樣做會節(jié)約FPGA的存儲器資源。但筆者認(rèn)為在算法運行過程中,擴(kuò)展密鑰進(jìn)程始終運行會增加FPGA芯片的動態(tài)功耗。另外,AES算法解密運算是從最后一輪子密鑰開始,只有擴(kuò)展出所有子密鑰才能啟動解密運算,因此制約了解密過程的實現(xiàn)。通常情況下初始密鑰不會頻繁改變,加/解密多包數(shù)據(jù)時可共享密鑰擴(kuò)展結(jié)果,同時由于Cyclone器件存儲器資源豐富,為存放子密鑰提供了足夠的空間。因此本文采用更普遍的做法,將所有子密鑰擴(kuò)展后保存在RAM中,使用時依次從RAM中讀取。這種方式不受加解密實現(xiàn)過程的限制,靈活性強(qiáng),非常適合于加密算法的FPGA實現(xiàn)。

從RAM中讀取子密鑰需要時間,為了避免算法第一個Add Round Key過程帶來的延時,可以將第一組子密鑰(初始密鑰)和最后一組子密鑰(解密過程第一組子密鑰)在寫入RAM的同時,分別保存在兩組寄存器中。如圖2所示,加/解密時直接利用寄存器結(jié)果進(jìn)入算法第一輪迭代,保證算法在10個時鐘內(nèi)完成10輪迭代,從而減少Add Round Key的時間。

使用FPGA實現(xiàn)AES算法的優(yōu)化設(shè)計

保存密鑰雖然多占用了約256個寄存器資源,但這樣做更易于實現(xiàn)算法的流水線操作,對提高整體性能有很大幫助。

2.3 輪函數(shù)優(yōu)化設(shè)計

優(yōu)化輪函數(shù)設(shè)計,減少輪函數(shù)的延時,是提高算法時鐘頻率的關(guān)鍵。本文通過對輪函數(shù)中Substitute Byte、Shift Row和Mix Column變換進(jìn)行優(yōu)化來提高算法的時鐘頻率。

輪函數(shù)中Substitute Byte(S-Box)是對一個字節(jié)的非線性操作。使用Verilog HDL描述S-Box通常有兩種方法:(1)使用case語句進(jìn)行行為描述,綜合后占用LE資源;(2)使用FPGA中的存儲器資源。AES算法的S-Box是一個8入8出的查找表,如果用LE實現(xiàn),則在Cyclone芯片中每個S-Box需要208個LE,AES算法的并行運算需要32個S-Box,共6656個LE,不但占用大量的硬件資源,而且使結(jié)構(gòu)復(fù)雜,增加了延時。而用存儲器資源實現(xiàn)S-Box,不需占用其他硬件資源,并且可以減少延時,是個很好的選擇。本文即采用這種方法,并充分利用器件資源:Cyclone器件中每個memory block可以設(shè)計為一個256×16bit的ROM,將加/解密過程的S-Box設(shè)計在同一個ROM內(nèi),加密S-Box內(nèi)容置于ROM的前8bit,解密S-Box內(nèi)容置于ROM的后8bit,這樣可以使memory block的數(shù)目比分別使用ROM設(shè)計時減少一半,大幅提高了資源利用率。Shift Row的硬件實現(xiàn)非常簡單,只是連線操作。為了進(jìn)一步降低由于連線引起的延時,將Substitute Byte與Shift Row合為一體,使兩部分延時僅取決于S-Box的ROM。Mix Column變換被定義為系數(shù)在有限域GF(28)上的四次多項式矩陣乘法,輸入列向量(X0,X1,X2,X3),輸出列向量(Y0,Y1,Y2,Y3),加密過程是在GF(28)上乘以01、02、03,解密過程相對復(fù)雜,是在GF(28)上乘以09、0E、0B、0D。為了簡化設(shè)計以便于FPGA實現(xiàn),可將矩陣乘法展開并整理,得到以下結(jié)果:

加密Mix Column:

使用FPGA實現(xiàn)AES算法的優(yōu)化設(shè)計

解密Mix Column:

使用FPGA實現(xiàn)AES算法的優(yōu)化設(shè)計

式中a是對一個字節(jié)的變換函數(shù),其Verilog HDL描述為:

a={b[6:0],1′b0}^(8′h1b&{8});

經(jīng)過整理,簡化了Mix Column實現(xiàn)過程,節(jié)約了硬件資源。Add Round Key只是簡單的異或,占用資源較少。優(yōu)化設(shè)計后輪函數(shù)的最大延時僅8.6ns,為提高整個設(shè)計的時鐘頻率提供了保障。

3 AES算法的快速實現(xiàn)

3.1 AES算法的硬件實現(xiàn)方式

AES算法的輪操作特點使得其硬件實現(xiàn)可以有多種方式:(1)串行運算:輪函數(shù)用組合邏輯實現(xiàn),10輪迭代過程直接相連,前一輪結(jié)果直接作為下一輪的輸入,1個時鐘周期內(nèi)完成一個分組運算,吞吐量可以達(dá)到最佳狀態(tài)。(2)基本迭代:采用反饋模式,所有迭代只用一個輪函數(shù),10個時鐘周期完成一個分組運算。(3)輪內(nèi)流水線:在每一個輪函數(shù)中插入寄存器,將一輪運算分成多個操作段,每個時鐘完成一個操作段,這種方式被很多人討論并使用,其優(yōu)點是可以提高算法運行的時鐘頻率。

在以上幾種AES算法實現(xiàn)方式中,方式(1)由于10個輪函數(shù)同時工作,不但需要大量的寄存器資源和組合邏輯資源的支持,而且還增加了延時,一般的FPGA芯片難以滿足容量的要求,時鐘頻率也非常低,所以這種方法不適合加密算法的硬件實現(xiàn)。方式(2)實現(xiàn)簡單,資源占用較少,但每個分組運算時間比較長,吞吐量仍然相對較低。在方式(3)中,由于加密算法的輪操作特點使得輪內(nèi)各級流水部件不能同時執(zhí)行,增加了算法運行的時鐘數(shù)目。輪內(nèi)流水線級數(shù)越多,時鐘數(shù)目也越多。雖然算法仿真頻率可以達(dá)到很高,但由于受硬件加密系統(tǒng)全局時鐘的影響,吞吐量并沒有明顯提高。

在對以上算法的幾種實現(xiàn)方式進(jìn)行分析后,本文基于流水線技術(shù),提出一種更快速的AES算法的FPGA實現(xiàn)方案。該方案即使在全局時鐘頻率較低的情況下,也能獲得很高的吞吐量。

3.2 流水線設(shè)計

AES算法結(jié)構(gòu)簡單,只需要邏輯運算和查找表運算。筆者通過優(yōu)化設(shè)計輪函數(shù),使得基本迭代方式下的時鐘頻率遠(yuǎn)高于PCI接口的時鐘頻率33MHz。本文在滿足算法時鐘頻率的基礎(chǔ)上,通過降低算法分組數(shù)據(jù)的處理時間來提高吞吐量。具體做法是:采用兩級輪外流水線,將AES算法的10輪迭代過程分為前后兩個操作段,每個操作段可作為一級流水線,在操作段內(nèi)部,每輪之間以反饋(FB)方式完成5輪基本迭代,前一個操作段結(jié)束后,將結(jié)果直接送入第二個操作段,同時去處理下一個分組數(shù)據(jù),兩個操作段互不影響,并行執(zhí)行。考慮到實際應(yīng)用中數(shù)據(jù)總線寬度(如PCI總線)通常為32位,這里將AES算法IP核的數(shù)據(jù)寬度設(shè)置為32位,4個時鐘輸入/輸出一個分組數(shù)據(jù)。為了與每一級流水線5輪迭代過程相匹配,在輸入/輸出分組數(shù)據(jù)的第5n個時鐘內(nèi)執(zhí)行一輪空操作,使得輸入明文數(shù)據(jù)、輸出密文結(jié)果、第一級流水線和第二級流水線四步操作同時執(zhí)行,從而實現(xiàn)圖3所示的流水線過程。在得到第一個分組結(jié)果后,每5個時鐘就會產(chǎn)生一個分組結(jié)果,從外部看起來,完成一個分組僅需要5個時鐘。

使用FPGA實現(xiàn)AES算法的優(yōu)化設(shè)計

3.3 實驗結(jié)果與性能分析

將設(shè)計在QuartusⅡ4.2軟件中綜合,仿真最高頻率為78.38MHz,完全可以滿足較低全局時鐘頻率的要求。整個系統(tǒng)設(shè)計采用33MHz時鐘,實驗測試結(jié)果表明,吞吐量已達(dá)到810Mbps。如果提高全局時鐘頻率,則吞吐量會超過1Gbps。

根據(jù)AES算法的特點及硬件加密系統(tǒng)的特點,給出了AES算法IP核的快速硬件設(shè)計方案。采用流水線技術(shù)和優(yōu)化設(shè)計,在較低頻率下,可以獲得很高數(shù)據(jù)吞吐量,使加密算法的FPGA實現(xiàn)過程不再是傳輸速度的瓶頸。整個設(shè)計具有很強(qiáng)的實用性,運行穩(wěn)定,且效果良好。對于AES算法分組長度和密鑰長度為192bit和256bit的情況,由于分組長度不同,執(zhí)行輪數(shù)有所增加。要實現(xiàn)流水線操作并在資源使用和吞吐量方面達(dá)到較好的效果,還需要進(jìn)一步優(yōu)化設(shè)計,這也是今后研究的方向。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1624

    文章

    21539

    瀏覽量

    600501
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5271

    瀏覽量

    119648
  • 計算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7292

    瀏覽量

    87523
收藏 人收藏

    評論

    相關(guān)推薦

    如何優(yōu)化AES算法中S-box和列混合單元?

    ,AES)。由于其較高的保密級別,AES算法被用來替代DES和3-DES,那么我們該如何優(yōu)化才能讓其適應(yīng)更為嚴(yán)苛的數(shù)據(jù)加密需要呢?
    發(fā)表于 08-06 06:19

    什么是AES算法? 怎樣快速實現(xiàn)AES算法?

    什么是AES算法?如何對AES算法進(jìn)行優(yōu)化?怎樣快速實現(xiàn)AE
    發(fā)表于 04-28 06:51

    基于FPGAAES加密算法的高速實現(xiàn)

    介紹AES 算法的原理以及基于FPGA 的高速實現(xiàn)。結(jié)合算法FPGA 的特點,采用查表法
    發(fā)表于 01-25 14:26 ?29次下載

    基于FPGAAES加密算法的高速實現(xiàn)

    介紹AES算法的原理以及基于FPGA的高速實現(xiàn)。結(jié)合算法FPGA的特點,采用查表法
    發(fā)表于 07-17 18:09 ?46次下載

    AES中SubBytes算法FPGA實現(xiàn)

    介紹了AES中,SubBytes算法FPGA的具體實現(xiàn).構(gòu)造SubBytes的S-Box轉(zhuǎn)換表可以直接查找ROM表來實現(xiàn).通過分析SubB
    發(fā)表于 11-09 16:42 ?25次下載

    AES算法中S-box和列混合單元的優(yōu)化FPGA技術(shù)實現(xiàn)

    AES算法中S-box和列混合單元的優(yōu)化FPGA技術(shù)實現(xiàn) 由于其較高的保密級別,AES
    發(fā)表于 04-23 09:34 ?2943次閱讀
    <b class='flag-5'>AES</b><b class='flag-5'>算法</b>中S-box和列混合單元的<b class='flag-5'>優(yōu)化</b>及<b class='flag-5'>FPGA</b>技術(shù)<b class='flag-5'>實現(xiàn)</b>

    AES中的字節(jié)替換的FPGA實現(xiàn)

    介紹 AES 中的字節(jié)替換算法原理并闡述基于FPGA的設(shè)計和實現(xiàn)。為了提高系統(tǒng)工作速度,在設(shè)計中應(yīng)用了流水線技術(shù)。最后利用MAXPLUS-II開發(fā)工具給出仿真結(jié)果,并分析了系統(tǒng)工作速度
    發(fā)表于 09-27 15:54 ?6006次閱讀
    <b class='flag-5'>AES</b>中的字節(jié)替換的<b class='flag-5'>FPGA</b><b class='flag-5'>實現(xiàn)</b>

    基于FPGA的SM3算法優(yōu)化設(shè)計與實現(xiàn)

    基于FPGA的SM3算法優(yōu)化設(shè)計與實現(xiàn)的論文
    發(fā)表于 10-29 17:16 ?5次下載

    基于AES加密算法的S盒優(yōu)化設(shè)計_胡春燕

    基于AES加密算法的S盒優(yōu)化設(shè)計_胡春燕
    發(fā)表于 03-19 11:31 ?2次下載

    基于AES算法硬件優(yōu)化及IP核應(yīng)用

    根據(jù)AES算法的特點,從3方面對算法硬件實現(xiàn)進(jìn)行改進(jìn):列混合部分使用查找表代替矩陣變換,降低算法實現(xiàn)
    發(fā)表于 11-02 10:59 ?0次下載
    基于<b class='flag-5'>AES</b><b class='flag-5'>算法</b>硬件<b class='flag-5'>優(yōu)化</b>及IP核應(yīng)用

    AES加密算法說明

    1 引 言 AES加密算法的一種優(yōu)化FPGA實現(xiàn)方法 隨著密碼分析水平,芯片處理能力和計算技術(shù)的不斷進(jìn)步,des的安全強(qiáng)度已經(jīng)難以適應(yīng)新的
    發(fā)表于 11-30 01:31 ?2111次閱讀

    AES算法中S—box和列混合單元的優(yōu)化FPGA實現(xiàn)的論文說明

    由于AES算法的硬件實現(xiàn)較為復(fù)雜,在此提出一種優(yōu)化算法中S—box和列混合單元的方法。其中S—box通過組合和有限域映射的方法進(jìn)行
    發(fā)表于 01-25 14:27 ?19次下載
    <b class='flag-5'>AES</b><b class='flag-5'>算法</b>中S—box和列混合單元的<b class='flag-5'>優(yōu)化</b>及<b class='flag-5'>FPGA</b><b class='flag-5'>實現(xiàn)</b>的論文說明

    使用FPGA實現(xiàn)AES分組密碼統(tǒng)一框架的詳細(xì)資料說明

    通過將AES算法模塊化、運算一般化,給出了類AES算法的統(tǒng)一框架。在此框架下不僅可以同時實現(xiàn)AES
    發(fā)表于 03-26 15:58 ?16次下載

    基于FPGAAES算法中S-box和列混合單元優(yōu)化

    基于FPGAAES算法中S-box和列混合單元優(yōu)化
    發(fā)表于 06-08 10:52 ?7次下載

    基于PIC單片機(jī)的AES算法優(yōu)化設(shè)計

    電子發(fā)燒友網(wǎng)站提供《基于PIC單片機(jī)的AES算法優(yōu)化設(shè)計.pdf》資料免費下載
    發(fā)表于 10-30 09:46 ?0次下載
    基于PIC單片機(jī)的<b class='flag-5'>AES</b><b class='flag-5'>算法</b><b class='flag-5'>優(yōu)化</b>設(shè)計