0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

區(qū)塊鏈科普:哈希函數(shù)算法

如意 ? 來源:以太坊愛好者 ? 作者:zhiachong ? 2020-06-28 09:25 ? 次閱讀

哈希值和哈希函數(shù)的概念是初次入門區(qū)塊鏈的人常聽到的兩個關鍵詞,而且似乎對安全性來說特別關鍵。(實際上也確實是。)對于像比特幣和以太坊這樣由成千上萬的節(jié)點通過 P2P 方法組成的去中心網(wǎng)絡來說,“免信任性” 和驗證效率無疑是關鍵。也就是說,這些系統(tǒng)需要找到方法把信息編碼成緊湊的形式,同時讓參與者能夠安全快速地進行驗證。

比特幣和以太坊網(wǎng)絡所處理的主要內(nèi)容叫做“區(qū)塊”,指的是由交易、時間戳和其他重要元數(shù)據(jù)所組成的數(shù)據(jù)結構。比特幣和以太坊網(wǎng)絡的安全性的關鍵一環(huán)是:它能將表達網(wǎng)絡全局狀態(tài)的大塊信息壓縮成一個簡短的消息。在有需要之時,我們可以高效地驗證這個消息的真實性。這個過程就是用哈希函數(shù)來完成的,而得到的結果(消息)就是哈希值。

即使只更改輸入中的一個字符,最后得出的哈希值也會完全不同

密碼學哈希廣泛應用于口令存儲和文件驗證系統(tǒng)。簡單來說,密碼學哈希函數(shù)是一種確定性的算法,不論輸入什么值,都能得到一個固定長度的字符串。也就是說,同一個輸入值始終對應同一個輸出值。

對哈希函數(shù)來說,重要的不僅是確定性(還有結果的隨機性):即使只更改輸入中的一個比特位,也會導致最終得到的哈希值截然不同。

哈希算法有一個無可回避的問題叫碰撞可能性。因為哈希值是固定長度的字符串,同一個輸出哈希值有可能對應多個輸入。碰撞會造成很嚴重的后果。如果有人能夠按需要發(fā)起碰撞攻擊,他就可以用恰當?shù)墓V祵阂馕募驍?shù)據(jù)偽裝成合法的、能夠通過驗證的文件。好的哈希函數(shù)的設計目標是讓攻擊者極難找到方法來找出對應同一個哈希的不同輸入。

哈希計算的效率不應過高,以免讓攻擊者可以更簡單地人為計算出碰撞。哈希算法必須能夠抵御“原像攻擊(pre-image attack)”。也就是說,對于特定哈希值,攻擊者很難通過確定性計算步驟倒推出輸入值(即,原像)。

假設 s = hash(x),倒推 x 應該是近乎不可能的。

總的來說,“好的” 哈希算法需要具備以下 3 個特性:

更改輸入中的一個比特位會產(chǎn)生雪崩效應,導致最后得出的哈希值截然不同

出現(xiàn)哈希碰撞的概率非常低

在無需犧牲抗碰撞性的前提下計算效率過得去

破解哈希算法

哈希算法的初始標準之一是 MD5 哈希。MD5 哈希廣泛應用于文件完整性驗證(校驗和),以及在網(wǎng)絡應用數(shù)據(jù)庫中存儲經(jīng)過哈希計算的賬號口令。MD5 的功能非常簡單,因為它會將每個輸入轉(zhuǎn)換成一個固定的 128 位字符串輸出,并通過多輪簡單的單向操作來計算確定性輸出。由于輸出值長度較短,操作又較為簡單,MD5 很容易被破解,一種常見的攻擊方法叫生日攻擊。

什么是生日攻擊?你有沒有聽說過這樣一個事實?如果你將 23 個人放到一個房間里,其中兩個人生日相同的概率為 50% 。如果將 70 個人放到一個房間里,其中兩個人生日相同的概率高達 99.9% 。這就是我們所說的鴿籠原理(pigeonhole principle),即將 100 只鴿子裝進 99 個鴿籠,必然有兩只鴿子分享同一個鴿籠。也就是說,固定長度的輸出意味著所有輸入輸出組合中一定存在碰撞。

籠子不夠時,鴿子就會湊對

事實上,MD5 的抗碰撞性太差,以至于一臺家用 2.4 GHz 奔騰處理器都能在幾秒內(nèi)計算出哈希碰撞。此外,由于 MD5 在互聯(lián)網(wǎng)早期階段得到了廣泛應用,網(wǎng)絡上有大量 MD5 原像遭到泄漏,通過谷歌搜索它們的哈希值就能找到。

哈希算法的多樣性發(fā)展

NSA (沒錯,就是美國國家安全保障局)是哈希算法標準的先驅(qū)。安全哈希算法(Secure Hashing Algorithm,SHA1)是最早提出的標準,將輸出值的長度固定在 160 位。遺憾的是,SHA1 只是在 MD5 的基礎上增加了輸出值長度、單向操作的次數(shù)和復雜度,但是并沒有作出能夠抵御更強大機器攻擊的根本性改進。

我們?nèi)绾尾拍茏龅酶茫?/p>

在 2006 年,美國國家標準技術研究所(NIST)舉辦了一場競賽,旨在找到一個本質(zhì)上不同于 SHA2 的替代標準。因此,SHA3 應運而生,它是 KECCAK 哈希算法的一種方案。

雖然 SHA 3 在名稱上與 SHA1 和 SHA2 一脈相承,但是在本質(zhì)上差異很大,因為它采用了一種名為海綿結構(sponge construct)的機制。該機制使用隨機排列來吸收并輸出數(shù)據(jù),同時為將來用于哈希算法的輸入值提供隨機性。

KECCAK256 海綿結構是如何進行輸入操作的

SHA3 的內(nèi)部狀態(tài)相較于輸出值擁有更多信息,突破了以往算法的局限性。NIST 于 2015 年正式認可了 SHA3 標準。

哈希計算和工作量證明

就整合進區(qū)塊鏈協(xié)議的哈希算法而言,比較早的比特幣選擇了 SHA256 ,而以太坊采用了改進后的 SHA3 (KECCAK256)作為工作量證明算法。對于采用工作量證明的區(qū)塊鏈來說,選擇哈希函數(shù)的一大重要標準是哈希運算效率。

使用一類名為專用集成電路ASIC)的硬件,我們可以大幅提高比特幣 SHA256 算法的哈希運算的效率。有很多文章已經(jīng)闡述了礦池是如何利用 ASIC 的,以及 ASIC 是如何讓協(xié)議趨向于計算中心化的。也就是說,工作量證明會激勵計算效率較高的機器聚集成礦池,從而形成較大的哈希算力(算力大小的衡量標準就是礦機在每個時間間隔內(nèi)可以完成多少次哈希運算)。

以太坊選擇的是改進后的 SHA3 算法(叫做 KECCAK256 )。此外,以太坊的工作量證明算法 Dagger-Hashimoto 被設計成了內(nèi)存密集型模式,計算硬件需要加大內(nèi)存才能提高計算效率。

那么,為什么比特幣采用雙重 SHA256 ?有趣的是,比特幣協(xié)議(的工作量證明)需要重復運行兩遍 SHA256 算法。請注意,這不是為了抵御生日攻擊,畢竟在 hash(x) = hash(y) 的情況下,hash(hash(x)) = hash(hash(y)) 。雙重 SHA256 旨在抵御長度擴展攻擊。

從本質(zhì)上來說,所謂的長度擴展攻擊,指的是如果惡意攻擊者知道了某個哈希輸入的長度,就可以在哈希值上添加一個秘密的字符串、欺騙哈希函數(shù)從其內(nèi)部狀態(tài)的一個特定部分開始計算。作為 SHA2 算法家族的一員,SHA256 也存在這一缺陷。因此,比特幣采取執(zhí)行兩遍哈希計算的方式來解決這一缺陷。

SHA3 并非哈希算法競賽取得的唯一突破。雖然最終勝出的是 SHA3 ,但是 BLAKE 算法緊隨其后,位居第二。對于以太坊 2.0 的分片實現(xiàn)來說,更高效的哈希算法可以說是一項功能性要求,研究團隊對此非常重視。BLAKE2b 哈希算法是 BLAKE 算法的高度升級版本。與 KECCAK256 相比,BLAKE2b 哈希算法在保持高度安全性的同時,在提升效率方面也進行了深入探索。

使用一臺現(xiàn)代 CPU 計算 BLAKE2b 的速度比計算 KECCAK 快了 3 倍。

哈希算法的前景展望

這么看來,無論我們做了什么,無非就是(1)增加內(nèi)部哈希操作的復雜度,或者(2)增加哈希輸出值的長度,讓攻擊者的計算機無法足夠快地有效計算出碰撞。

我們依靠單向操作的原像模糊性來保護網(wǎng)絡的安全性。也就是說,哈希算法的安全性目標是在有無限多可能的沖突的情況下,讓找出哈希碰撞的難度盡可能高。

如果量子計算時代到來,哈希算法依然安全嗎?

就目前來看,答案是肯定的,哈希算法將經(jīng)受時間的考驗,抵御量子計算。量子計算能夠解決的是那些嚴格按照某些小技巧或 RSA 加密理論打造底層結構的數(shù)學問題。另一方面,哈希算法的內(nèi)部構造沒那么形式化。

量子計算機確實能夠提高哈希等非結構化問題的計算速度,但它們最終還是會像如今的計算機一樣采取暴力破解手段。

無論我們?yōu)閰f(xié)議選擇了哪種算法,我們顯然都在邁向計算高效化的未來。為此,我們必須慎重選擇最合適的工具,使之經(jīng)受住時間的檢驗。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 哈希函數(shù)

    關注

    0

    文章

    43

    瀏覽量

    9427
  • 區(qū)塊鏈
    +關注

    關注

    110

    文章

    15558

    瀏覽量

    105486
收藏 人收藏

    評論

    相關推薦

    華為云、上海鈞達數(shù)科 發(fā)布區(qū)塊數(shù)據(jù)要素聯(lián)合解決方案

    【摘要】 9 月 19 日,在華為全聯(lián)接大會 2024 期間,華為云與上海鈞達數(shù)科在上海世博展覽館聯(lián)合發(fā)布了基于華為云區(qū)塊打造“區(qū)塊數(shù)據(jù)要素解決方案”。 9 月 19 日,在華為全
    的頭像 發(fā)表于 10-09 20:16 ?145次閱讀
    華為云、上海鈞達數(shù)科 發(fā)布<b class='flag-5'>區(qū)塊</b><b class='flag-5'>鏈</b>數(shù)據(jù)要素聯(lián)合解決方案

    科技少年夢 科普粵海行|芯??萍?b class='flag-5'>科普基地啟迪智慧未來

    9月28日,由深圳市南山區(qū)粵海街道辦事處主辦,深圳市高科技協(xié)同創(chuàng)新促進會、深愛人才館策劃執(zhí)行的“科技少年夢科普粵海行”系列活動之“芯片探秘啟未來”芯??萍籍a(chǎn)品體驗日成功舉行,吸引了眾多青少年及家長
    的頭像 發(fā)表于 10-01 08:07 ?174次閱讀
    科技少年夢 <b class='flag-5'>科普</b>粵海行|芯??萍?b class='flag-5'>科普</b>基地啟迪智慧未來

    京準電鐘:GPS北斗衛(wèi)星校時服務器助力區(qū)塊數(shù)據(jù)網(wǎng)

    京準電鐘:GPS北斗衛(wèi)星校時服務器助力區(qū)塊數(shù)據(jù)網(wǎng)
    的頭像 發(fā)表于 09-27 10:43 ?190次閱讀
    京準電鐘:GPS北斗衛(wèi)星校時服務器助力<b class='flag-5'>區(qū)塊</b><b class='flag-5'>鏈</b>數(shù)據(jù)網(wǎng)

    開源物聯(lián)網(wǎng)技術--哈希算法MD5加密功能技術分享

    MD5(Message-Digest Algorithm 5)是一種常用的哈希函數(shù),通常用于數(shù)據(jù)加密和安全校驗等場合。MD5 算法可以將任意長度的消息輸入計算出一個固定長度的摘要,其生成的摘要具有
    的頭像 發(fā)表于 09-21 09:57 ?642次閱讀
    開源物聯(lián)網(wǎng)技術--<b class='flag-5'>哈希</b><b class='flag-5'>算法</b>MD5加密功能技術分享

    探索無限可能:華為云區(qū)塊 +X,創(chuàng)新融合新篇章

    ? 6 月 23 日,華為開發(fā)者大會 2024(HDC 2024)期間,?“「區(qū)塊+X」多元行業(yè)場景下的創(chuàng)新應用”分論壇在東莞松山湖舉行,區(qū)塊技術再次成為焦點。本次論壇以"
    的頭像 發(fā)表于 07-09 12:27 ?3700次閱讀
    探索無限可能:華為云<b class='flag-5'>區(qū)塊</b><b class='flag-5'>鏈</b> +X,創(chuàng)新融合新篇章

    科普EEPROM 科普 EVASH Ultra EEPROM?科普存儲芯片

    科普EEPROM 科普 EVASH Ultra EEPROM?科普存儲芯片
    的頭像 發(fā)表于 06-25 17:14 ?417次閱讀

    區(qū)塊互操作標準化應用及經(jīng)驗,華為云 BCS 獲評團體標準示范項目

    區(qū)塊技術發(fā)展的關鍵 區(qū)塊作為一種分布式賬本技術,具多方共識、分布式存儲、難以篡改等 特點,在金融科技、政務民生、司法存證、供應協(xié)同、稅
    的頭像 發(fā)表于 02-23 22:00 ?578次閱讀
    <b class='flag-5'>區(qū)塊</b><b class='flag-5'>鏈</b>互操作標準化應用及經(jīng)驗,華為云 BCS 獲評團體標準示范項目

    如何使用Rust從零開發(fā)區(qū)塊

    區(qū)塊的Body部分是一個普通的字符串向量,而頭部看起來更有趣。在所有的字段中,prev_hash 是最有趣的,它存儲了前一個區(qū)塊哈希字段值,我們將在這篇文章后面的部分討論它。
    的頭像 發(fā)表于 01-22 13:58 ?1122次閱讀
    如何使用Rust從零開發(fā)<b class='flag-5'>區(qū)塊</b><b class='flag-5'>鏈</b>

    區(qū)塊是什么樣的數(shù)據(jù)結構組織

    區(qū)塊是一種特殊的數(shù)據(jù)結構,它以分布式、去中心化的方式組織和存儲數(shù)據(jù)。區(qū)塊的核心原理是將數(shù)據(jù)分布在網(wǎng)絡的各個節(jié)點上,通過密碼學算法保證數(shù)據(jù)
    的頭像 發(fā)表于 01-11 10:57 ?1569次閱讀

    區(qū)塊技術發(fā)展現(xiàn)狀和趨勢

    進行詳盡的分析。 一、區(qū)塊技術的起源和原理 區(qū)塊技術最早在2008年由中本聰提出,而該技術的最著名應用就是比特幣。比特幣是基于去中心化的區(qū)塊
    的頭像 發(fā)表于 01-11 10:31 ?1993次閱讀

    區(qū)塊系統(tǒng)軟件開發(fā)與應用

    區(qū)塊技術是近年來備受矚目的創(chuàng)新技術,被廣泛應用于金融、供應管理、物聯(lián)網(wǎng)等領域。區(qū)塊系統(tǒng)軟件開發(fā)是實現(xiàn)
    的頭像 發(fā)表于 01-10 18:18 ?2280次閱讀

    基于區(qū)塊的自動駕駛車輛電池壽命預測方法

    基于區(qū)塊的自動駕駛車輛電池壽命預測方法
    的頭像 發(fā)表于 01-05 10:27 ?384次閱讀
    基于<b class='flag-5'>區(qū)塊</b><b class='flag-5'>鏈</b>的自動駕駛車輛電池壽命預測方法

    智慧構思:智能合約技術精髓與價值轉(zhuǎn)化?——華為云BCS區(qū)塊服務

    在金融、供應、醫(yī)療、版權管理等項目中,涉及數(shù)據(jù)與價值傳輸?shù)牡胤剑嬖?b class='flag-5'>區(qū)塊技術支持。行業(yè)領先者早已把握風潮,積極探索實踐,部署區(qū)塊,推
    的頭像 發(fā)表于 11-25 17:35 ?608次閱讀
    智慧構思:智能合約技術精髓與價值轉(zhuǎn)化?——華為云BCS<b class='flag-5'>區(qū)塊</b><b class='flag-5'>鏈</b>服務

    如何使用Go語言搭建區(qū)塊基礎

    區(qū)塊是一種去中心化的分布式數(shù)據(jù)庫,其中的數(shù)據(jù)以區(qū)塊的形式存儲,并通過密碼學的技術保證數(shù)據(jù)的安全性和不可篡改性。每個區(qū)塊包含了一定數(shù)量的交易數(shù)據(jù),而且每個
    的頭像 發(fā)表于 11-13 10:07 ?972次閱讀

    區(qū)塊數(shù)據(jù)儲存在哪里呢?區(qū)塊數(shù)據(jù)儲存的方式有哪些類型和特點?

    區(qū)塊數(shù)據(jù)儲存在哪里呢?區(qū)塊數(shù)據(jù)儲存的方式有哪些類型和特點? 區(qū)塊是一種去中心化的數(shù)據(jù)存儲方
    的頭像 發(fā)表于 10-26 11:16 ?3828次閱讀