0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于Verilog硬件描述語言實現(xiàn)SHA-1算法的設計

電子設計 ? 來源:清華大學學報(自然科學版 ? 作者:黃諄,白國強,陳弘 ? 2020-11-28 10:16 ? 次閱讀

單向散列函數(shù)是密碼學中一種重要的工具,它可以將一個較長的位串映射成一個較短的位串,同時它的逆函數(shù)很難求解。許多安全技術中都會用到單向散列函數(shù)的這種特殊性質,比如數(shù)字簽名、密碼保護、消息鑒別等。鑒于單向散列函數(shù)在密碼系統(tǒng)中的重要地位,密碼學家們設計了各種各樣的安全散列函數(shù)。目前最常用的散列函數(shù)是NIST于1995年頒布的安全散列算法SHA-1。

SHA-1算法和之前的MD4、MD5等安全散列算法原理很接近,但是安全性更好。它可以通過一系列的迭代計算把任意長度的比特串壓縮成長度為160bit的位串。而且一般認為它的這個計算過程在密碼學意義上是單向的,也就是說很難找到兩個不同的位串可以壓縮成相同的160bit。到目前為止,還沒有對SHA-1有效的攻擊方法。

由于SHA-1算法的良好特性,它被廣泛使用在諸如電子商務這樣的現(xiàn)代安全領域,尤其是被大量應用于公鑰密碼系統(tǒng)的數(shù)字簽名中。目前幾乎所有相關密碼協(xié)議、標準或者系統(tǒng)中,都包括了SHA-1算法,其中比較著名的有SSL、IPSec和PKCS。在這些場合下,能否快速計算出消息的散列值直接影響到整個系統(tǒng)的處理能力。但是,由于SHA-1算法本身是一個很復雜的算法,計算量也較大,加上每次迭代都需要依賴上次的計算結果,因此不論是硬件還是軟件實現(xiàn),計算速度都很有限,這大大限制了算法的適用場合。

本文提出一種新的硬件實現(xiàn)方法,通過改變迭代結構,達到縮短關鍵路徑的目的,進而提高SHA-1的計算速度。

SHA-1算法

算法描述

SHA-1算法能夠將任意長的輸入壓縮成160bit的輸出。但是,SHA-1算法中的基本迭代只能處理512bit的數(shù)據(jù)塊,因此為了處理任意長度的數(shù)據(jù),首先需要將輸入的消息每512bit分成一塊,并且將最后一塊不足512bit的消息按一定規(guī)則補齊。(限于篇幅,SHA-1算法的詳細描述見文[1],下面是算法進一步的簡單描述。)

分塊之后就可以對每塊消息按下述方法依次進行處理。

1)在5個中間變量H0、H1、H2、H3和H4中置入特定初值。

2)對每塊消息依次執(zhí)行步驟a)到e)

a)將512bit的消息塊分成16個32bit的字W0,W1,…,W15;

b)For t=16 to 79l etWt=S1(W t-3W t-8

W t-14

W t-16);

c)LetA=H0,B=H1,C=H2,D=H3,E=H4;

d)For t=0 to 79 do

i)TEMP=S 5 (A)+f t(B,C,D)+E+Wt+Kt;

ii)E=D;D=C;C=S30(B);B=A;A=TEMP;

e)LetH0=H0+A,H1=H1+B,H2=H2+C,H3=H3+D,H4=H4+E。

所有消息塊處理完后得到的5個32bit變量H0到H4構成了160bit的數(shù)據(jù),這就是SHA-1算法輸出的散列值。

算法中使用了一些簡單的邏輯函數(shù)和常數(shù),其中函數(shù)ft()和常數(shù)Kt分別為

算法中S1(*)、S5(*)和S30(*)分別表示按位循環(huán)左移1bit、5bit和30bit。算子“∧”、“∨”、“?”和“+”分別表示按位“與”、按位“或”、按位“異或”以及32bit整數(shù)加法。

算法分析

從算法描述可以看出,SHA-1最核心的計算是一個計算5個中間變量的迭代:

An=S5(A n-1)+f n(B n-1,C n-1,D n-1)+

E+Wn+Kn,

Bn=A n-1,

Cn=S30(B n-1),

Dn=C n-1,

En=D n-1.

在硬件實現(xiàn)中,5個變量在一個周期內同時由組合邏輯電路根據(jù)上次迭代的計算值產(chǎn)生,因此每次迭代所需要的時間是由最慢的計算過程決定。這樣一條最慢的計算路徑也就是所謂的關鍵路徑。如果完全按照SHA-1的原始算法進行硬件設計,那么很明顯的關鍵路徑是變量A的計算。在每次迭代過程中,計算變量A需要進行4次32bit的整數(shù)加法和若干組合邏輯。這些計算一共需要的時間也就是算法硬件實現(xiàn)的最短周期。正是因為變量A的計算比較復雜,造成SHA-1算法硬件實現(xiàn)的工作頻率難以提高。

因此,加快SHA-1硬件實現(xiàn)的計算速度關鍵就是改變迭代結構,從而縮短每次迭代過程的關鍵路徑。

硬件快速實現(xiàn)的新結構

觀察算法可發(fā)現(xiàn),除了變量A以外,其他4個變量的計算都相當簡單。因此,如果將變量A的計算過程通過一定方式分解成若干并行的計算,那么就可以在不增加迭代次數(shù)的前提下,縮短整個計算的關鍵路徑。

出于這種目的,1997年A.Bosselaers等人對SHA-1算法的結構進行了分析,發(fā)現(xiàn)SHA-1算法的數(shù)據(jù)流圖可以分解成并行的7路數(shù)據(jù)處理,每路數(shù)據(jù)上一個周期只需一個基本操作:加法、“異或”或者循環(huán)移位。

在此關于SHA-1結構結論的基礎上,本文通過引入中間變量的方法,將計算的關鍵路徑分解成若干個較短的路徑,從而達到加速硬件計算的效果??紤]到硬件實現(xiàn)中32bit整數(shù)加法的延時遠遠大于循環(huán)移位和普通邏輯運算,所以分析關鍵路徑時只考慮加法的代價,而忽略其他邏輯運算的延時。

首先引入中間變量P n-1=fn(B n-1,C n-1,D n-1)+E n-1+Wn+Kn,那么可以得到An=S5(A n-1)+P n-1。也就是說,將第n次迭代的部分計算提前到第n-1次迭代中進行計算。變形后,第n次迭代中A的計算只需要進行一次32bit整數(shù)加法。

但是這種方式下,變量P的計算仍然需要依賴于同一次迭代中的其他變量,也就是說在一次迭代中需要在計算完其他變量后才能計算出P,這樣的話計算的關鍵路徑還是沒有縮短。所以還要充分利用A到E5個變量之間的相互關系

B n-1=A n-2,

C n-1=S30(B n-2),

D n-1=C n-2,

E n-1=D n-2.

將P的計算變化為P n-1=f n(A n-2,S30(B n-2),C n-2)+D n-2+Wn+Kn。如此之后,第n-1輪的P值可以完全依賴于前一輪也就是第n-2輪的變量值計算而得。迭代計算的關鍵路徑就分裂成變量A和P兩路并行的計算。

類似的再引入其他中間變量,不斷的分解關鍵路徑,最終的迭代可變形為

An=S5(A n-1)+P n-1,

Pn=f n+1(A n-1,S30(B n-1),C n-1)+Q n-1,

Qn= C n-1+R n-1,

Rn=W n+3+K n+3,

Bn=A n-1,

Cn=S30(B n-1)。

可以發(fā)現(xiàn)通過引入中間變量,使得計算變量A的關鍵路徑分解成A、P、Q、R的4路并行計算,所需要的4次加法平均在4個周期內完成。這樣每次迭代過程中任何一個變量的計算最多只需要一次32bit整數(shù)加法和少量組合邏輯。在此基礎上,SHA-1算法可以通過如下方法來計算

1)將輸入的512bit消息分成16個字W0,W1, …,W15;

2)For t=16 to 79 let Wt=S1(W t-3

W t-8

W t-14

W t-16);

3)LetA=H0,B=H1,C=H2,D=H3;

4)LetP=f 0 (B,C,D)+E+W0+K0,Q=D+W1+K1,R=W2+K2;

5)Fort=0 to 79 do

a)TEMP=S5(A)+P;

b)P=f t+1(A,S30(B),C)+Q;

c)Q=C+R;

d)R=W t+3+K t+3;

e)B=A;C=S30(B);A=TEMP;

6)LetH0=H0+A,H1=H1+B,H2=H2+C,H3=H3+S30(A76),H4=H4+S30(A75)。

雖然引入中間變量的計算后,每塊數(shù)據(jù)需要額外增加一個預計算的步驟4),但是因為關鍵路徑得以縮短,整體硬件實現(xiàn)的速度仍然會大大提高。

實現(xiàn)結果

使用Verilog硬件描述語言按本文提出的優(yōu)化方法實現(xiàn)了SHA-1算法,并使用Synopsys Design Compiler在0.18Lm標準單元庫下綜合,得到表1中的結果。表1中還包括了文[6]的實現(xiàn)結果。文[6]同樣使用了0.18Lm工藝,但是實現(xiàn)SHA-1算法的方法仍然是傳統(tǒng)的直接計算ABCDE5個中間變量的方法。

表1ASIC實現(xiàn)結果比較

從前文的算法分析可以看出,傳統(tǒng)實現(xiàn)方法的關鍵路徑上有4次加法,如果把這4次加法按樹型組織,那么關鍵路徑的延時大約為3個32bit加法器的延時;通過本文方法改進后,關鍵路徑延時可以縮短為1個32bit加法器延時加上少量組合邏輯延時。因此理論上速度大約可以提高為傳統(tǒng)方法的2~3倍。從表1和使用傳統(tǒng)方法實現(xiàn)的文[6]對比可以發(fā)現(xiàn),實現(xiàn)結果和理論分析完全一致。改進方法因為計算中引入了中間變量,所以面積比傳統(tǒng)方法要略大;同時為了計算中間變量的初值,每塊數(shù)據(jù)也需要多兩個周期的計算。但是因為關鍵路徑得以明顯縮短,整體的計算速度大大提高,吞吐量達到傳統(tǒng)方法的兩倍以上。

通過縮短關鍵路徑加速SHA-1計算的方法不僅適用于ASIC設計,而且一樣適用于基于FPGA的硬件設計。文[6,7]是目前常用的兩種SHA-1算法的商業(yè)IP核。使用本文提出的改進方法在和文[6,7]同樣的FPGA芯片上(XilinxVirtex2II系列XC2V50025)實現(xiàn)SHA-1算法。具體結果以及和文[6,7]結果的對比見表2。

表2FPGA實現(xiàn)結果比較

結論

針對有理分式擬合中的保證生成二端口網(wǎng)絡無源性的問題,本文提出了一種簡單且有效的局部補償方法,其主要思想在于:在生成網(wǎng)絡的Y參數(shù)矩陣的對角元素上加上(相當于并聯(lián))一個RLC串聯(lián)的濾波回路,使得該回路可以以恰好補償原網(wǎng)絡違反無源性條件的頻率段,而盡量少的引入誤差。經(jīng)過實驗表明,該方法能很好的達到預期的目的,在保證無源性條件的同時,能使引入的誤差限制在2%以內。

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1624

    文章

    21575

    瀏覽量

    600773
  • asic
    +關注

    關注

    34

    文章

    1179

    瀏覽量

    120170
  • 加法器
    +關注

    關注

    6

    文章

    183

    瀏覽量

    30046
收藏 人收藏

    評論

    相關推薦

    請問如何使用Verilog硬件描述語言實現(xiàn)AES密碼算法?

    如何使用Verilog硬件描述語言實現(xiàn)AES密碼算法?
    發(fā)表于 04-14 06:29

    Verilog硬件描述語言描述.

    本書簡要介紹了Verilog硬件描述語言的基礎知識,包括語言的基本內容和基本結構 ,以及利用該語言在各種層次上對數(shù)字系統(tǒng)的建模方法
    發(fā)表于 03-27 23:44 ?101次下載

    VERILOG HDL硬件描述語言

    本書簡要介紹了Verilog硬件描述語言的基礎知識,包括語言的基本內容和基本結構 ,以及利用該語言在各種層次上對數(shù)字系統(tǒng)的建模方法。書中列舉
    發(fā)表于 07-20 11:36 ?0次下載

    Verilog HDL硬件描述語言【書籍

    本書簡要介紹了Verilog 硬件描述語言的基礎知識,包括語言的基本內容和基本結構,以及利用該語言在各種層次上對數(shù)字系統(tǒng)的建模方法。書中列舉
    發(fā)表于 07-02 14:55 ?124次下載

    verilog硬件描述語言課程講義

    verilog硬件描述語言課程講義
    發(fā)表于 05-21 15:01 ?33次下載
    <b class='flag-5'>verilog</b><b class='flag-5'>硬件</b><b class='flag-5'>描述語言</b>課程講義

    Verilog硬件描述語言參考手冊

    Verilog硬件描述語言參考手冊,Verilog語法內容介紹
    發(fā)表于 11-12 17:20 ?0次下載

    Verilog HDL硬件描述語言

    Verilog HDL硬件描述語言 有需要的下來看看
    發(fā)表于 12-29 15:31 ?0次下載

    Verilog硬件描述語言

    VHDL語言編程學習Verilog硬件描述語言
    發(fā)表于 09-01 15:27 ?0次下載

    Verilog HDL硬件描述語言

    Verilog HDL硬件描述語言,感興趣的小伙伴們可以瞧一瞧。
    發(fā)表于 11-11 11:20 ?11次下載

    基于SHA-1算法硬件設計及實現(xiàn)(FPGA實現(xiàn)

    算法進行深入研究,面向Xilinx K7 410T FPGA 芯片設計SHA-1算法實現(xiàn)結構,完成SHA-1
    發(fā)表于 10-30 16:25 ?4次下載
    基于<b class='flag-5'>SHA-1</b><b class='flag-5'>算法</b>的<b class='flag-5'>硬件</b>設計及<b class='flag-5'>實現(xiàn)</b>(FPGA<b class='flag-5'>實現(xiàn)</b>)

    基于Verilog硬件描述語言的IEEE標準硬件描述語言資料合集免費下載

    本文檔的主要內容詳細介紹的是基于Verilog硬件描述語言的IEEE標準硬件描述語言資料合集免費下載:1995、2001、2005;Syst
    發(fā)表于 06-18 08:00 ?10次下載

    基于VHDL硬件描述語言實現(xiàn)CPSK調制的程序及仿真

    本文檔的主要內容詳細介紹的是基于VHDL硬件描述語言實現(xiàn)CPSK調制的程序及仿真。
    發(fā)表于 01-19 14:34 ?11次下載
    基于VHDL<b class='flag-5'>硬件</b><b class='flag-5'>描述語言實現(xiàn)</b>CPSK調制的程序及仿真

    如何使用VHDL硬件描述語言實現(xiàn)基帶信號的MPSK調制

    本文檔的主要內容詳細介紹的是如何使用VHDL硬件描述語言實現(xiàn)基帶信號的MPSK調制。
    發(fā)表于 01-19 14:34 ?2次下載
    如何使用VHDL<b class='flag-5'>硬件</b><b class='flag-5'>描述語言實現(xiàn)</b>基帶信號的MPSK調制

    Verilog硬件描述語言的學習課件免費下載

    本文檔的主要內容詳細介紹的是Verilog硬件描述語言的學習課件免費下載。
    發(fā)表于 01-22 12:13 ?17次下載
    <b class='flag-5'>Verilog</b><b class='flag-5'>硬件</b><b class='flag-5'>描述語言</b>的學習課件免費下載

    使用Verilog/SystemVerilog硬件描述語言練習數(shù)字硬件設計

    HDLBits 是一組小型電路設計習題集,使用 Verilog/SystemVerilog 硬件描述語言 (HDL) 練習數(shù)字硬件設計~
    的頭像 發(fā)表于 08-31 09:06 ?1601次閱讀