0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖解B+樹的生成過程!

jf_ro2CN3Fa ? 來源:芋道源碼 ? 作者:芋道源碼 ? 2022-12-01 10:15 ? 次閱讀


本文大概字數(shù)三千多,預(yù)計觀看時長十分鐘,練習(xí)時長兩個半小時。希望大家都能學(xué)到知識。

前提

不少網(wǎng)友看 B+ 樹,看不懂樹結(jié)構(gòu)什么意思。希望本文可以幫你理解樹結(jié)構(gòu)生成的過程。

在說 B+ 樹之前,需要知道,一頁的大小是多少。

showglobalstatuslike'innodb_page_size'
eaf95904-711c-11ed-8abf-dac502259ad0.jpgMySQL一頁16kb

這個是看出,一頁是 16384 也就是16384/1024 = 16kbinnodb 中一頁的大小默認是 16kb。

基于 Spring Boot + MyBatis Plus + Vue & Element 實現(xiàn)的后臺管理系統(tǒng) + 用戶小程序,支持 RBAC 動態(tài)權(quán)限、多租戶、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能

  • 項目地址:https://github.com/YunaiV/ruoyi-vue-pro
  • 視頻教程:https://doc.iocoder.cn/video/

正文

創(chuàng)建表結(jié)構(gòu) 指定引擎為 Innodb。

CREATETABLEtree(
idintPRIMARYkeyauto_increment,
t_nameVARCHAR(20),
t_codeint
)ENGINE=INNODB

查看一下當前表的索引情況

showindexfromtree

B 樹和 B+ 樹的顯示都是 BTREE,但是實際使用的 B+ 樹。B+ 樹也是 B 樹的升級版,這里顯示為 B 樹也是沒有問題的。

eb0f3fda-711c-11ed-8abf-dac502259ad0.jpgBTREE

創(chuàng)建數(shù)據(jù),這里會有一個小知識點,如果看過上一篇文章的朋友可以明白是為什么。

INSERTintotreeVALUES(3,"變成派大星",3);
INSERTintotreeVALUES(1,"變成派大星",1);
INSERTintotreeVALUES(2,"變成派大星",2);
INSERTintotreeVALUES(4,"變成派大星",4);
INSERTintotreeVALUES(7,"變成派大星",7);
INSERTintotreeVALUES(5,"變成派大星",5);
INSERTintotreeVALUES(6,"變成派大星",6);
INSERTintotreeVALUES(8,"變成派大星",8);
eb24a06e-711c-11ed-8abf-dac502259ad0.jpg插入測試數(shù)據(jù)

疑問

為什么創(chuàng)建數(shù)據(jù)的時候數(shù)據(jù)是亂序的,但是在創(chuàng)建好數(shù)據(jù),被排好順序了。

基礎(chǔ)知識

我們在尋找答案之前,想明白一些基礎(chǔ)知識。

細心的朋友可以看出來,我們插入 Id 時候數(shù)據(jù)是亂的,插入進去之后,數(shù)據(jù)就自動幫我通過 Id 進行排序了,這是為什么呢?接著往下看。

我們?nèi)绻麑τ?B+ 樹有點了解的話就知道 B+ 樹是每頁 16KB 進行數(shù)據(jù)儲存。在進行數(shù)據(jù)查詢的時候也是一頁一頁的去查詢。

相當于下面的數(shù)據(jù)。

首先每一頁都有很多數(shù)據(jù),就像我們平常去寫分頁的時候我們返回給前端的數(shù)據(jù)也會有很多屬性。

eb366c36-711c-11ed-8abf-dac502259ad0.jpgMySQL數(shù)據(jù)頁

這個可能比較抽象,我是把他當成平常,分頁查詢的思想代入進去。

我們可以把一頁想成是一個對象。

@Data
publicclasspage{
Listdata;
//....省略其余屬性
}

我們先看一下,一頁數(shù)據(jù)的圖是什么樣子,僅僅是進行邏輯思考畫的圖。

這里的 Data,就相當于 一頁中的數(shù)據(jù)區(qū)域。

eb466f96-711c-11ed-8abf-dac502259ad0.jpg數(shù)據(jù)區(qū)域

但是這里是有限制的,上面我們說到,一頁的數(shù)據(jù)只能是 16Kb,也就是一個 Page 里面的 data 只能16Kb。當數(shù)據(jù)超過 16Kb,就會新開一個對象相當于在進行創(chuàng)建樹的時候增加了判斷。

Java 代碼思路模擬

eb5ba1c2-711c-11ed-8abf-dac502259ad0.jpgJava模擬MySQL數(shù)據(jù)頁

當 Page 對象的大小已經(jīng)達到16Kb 就算完成這一頁。把這一頁放到,磁盤中等待使用就行了,到時候進行查詢數(shù)據(jù)的時候會直接返回這一頁,里面包含這些數(shù)據(jù)。

我們回到最初的問題 為什么我們在進行插入的時候明明 Id 是亂的?等到插入到數(shù)據(jù)的時候,數(shù)據(jù)就變成有序的了?我們知道,同時這個數(shù)據(jù)是根據(jù)主鍵進行排序的,InnoDB 的數(shù)據(jù)儲存一定是要依賴主鍵的,有些人會想,我就是不創(chuàng)建主鍵,他還能排序嗎?

疑問二

我們在疑問一的基礎(chǔ)上,產(chǎn)生出的疑問,不設(shè)置主鍵 Mysql 怎么辦?

解答

InnoDB 對聚簇索引處理如下:

  • 如果定義了主鍵,那么 InnoDB 會使用主鍵作為聚簇索引
  • 如果沒有定義主鍵,那么會使用第一非空的唯一索引(NOT NULL and UNIQUE INDEX)作為聚簇索引
  • 如果既沒有主鍵也找不到合適的非空索引,InnoDB 會自動幫你創(chuàng)建一個不可見的、長度為 6 字節(jié)的 row_id,而且 InnoDB 維護了一個全局的 dictsys.row_id,所以未定義主鍵的表都共享該row_id,每次插入一條數(shù)據(jù),都把全局 row_id 當成主鍵 id,然后全局 row_id 加 1

很明顯,缺少主鍵的表,InnoDB 會內(nèi)置一列用于聚簇索引來組織數(shù)據(jù)。而沒有建立主鍵的話就沒法通過主鍵來進行索引,查詢的時候都是全表掃描,小數(shù)據(jù)量沒問題,大數(shù)據(jù)量就會出現(xiàn)性能問題。

但是,問題真的只是查詢影響嗎?不是的,對于生成的 ROW_ID,其自增的實現(xiàn)來源于一個全局的序列,而所以有 ROW_ID 的表共享該序列,這也意味著插入的時候生成需要共享一個序列,那么高并發(fā)插入的時候為了保持唯一性就避免不了鎖的競爭,進而影響性能

解答

我們看完疑問二的解答就知道,即便我們不設(shè)置主鍵。數(shù)據(jù)也會幫我們?nèi)ド梢粋€默認的主鍵,有點像,類默認生成構(gòu)造器的思想。

有了主鍵之后呢?

eb6f4362-711c-11ed-8abf-dac502259ad0.jpg表中有主鍵

為什么會自動排序,大家都知道了。其實在文章之初就會有很多人明白是為什么,大概腦子里會有答案。

疑問三

為什么要進行排序?

解答

我們都知道,在進行數(shù)據(jù)查找的時候,比如幾個基礎(chǔ)的查找算法的,前提都是,先進行排序。再者 List 和 Map 的一些區(qū)別肯定都很熟悉了。排序當然是為了更快,所以無須的 Id 會對插入效率造成影響,也就是為什么很多文章說使用自增 Id 比 UUID 或者雪花算效率高的原因。第一個是 UUID 他們是隨機的 每次都要重新排序,甚至可能會因為排序的原因造成頁數(shù)據(jù)的更換。還有就是 UUID 一般都比較長,一頁是 16Kb 數(shù)據(jù)越短。一頁的數(shù)據(jù)就會越多,查詢的速度也就比較快。

這里說完為什么排序 還有一個點就是上面的「頁目錄」

疑問三

頁目錄的作用是什么?

頁目錄的作用是減少范圍。

eb885d0c-711c-11ed-8abf-dac502259ad0.jpg頁目錄

這里的第三層是數(shù)據(jù),上面都是目錄,可以增加數(shù)據(jù)的檢索效率。

eba9746a-711c-11ed-8abf-dac502259ad0.jpg頁目錄增加數(shù)據(jù)的檢索效率

如果沒有目錄我們需要去直接遍歷數(shù)據(jù)區(qū)域,會降低效率。目錄能幫我們縮小范圍,這里,我們查詢 ID = 3。我們可以通過目錄知道 1 < 3 < 4,如果在 1 中沒有找到對應(yīng)數(shù)據(jù)。但是因為 3 < 4 就不會接著往下查詢了,直接返回空結(jié)果。

當?shù)谝豁摏]有的時候去第二頁查詢,不會直接跳到第二頁查詢。

ebc12d6c-711c-11ed-8abf-dac502259ad0.jpg提高范圍查找效率

為了提高效率,當目錄數(shù)據(jù)數(shù)量過多時,就會網(wǎng)上延伸一層樹,同時可以減少磁盤的 IO 次數(shù)。

ebe4f68e-711c-11ed-8abf-dac502259ad0.jpg索引就是一顆樹

關(guān)于所有葉子節(jié)點都處于同一深度是如何實現(xiàn)的?這與 B+ 樹具體的插入和刪除算法有關(guān)。簡單解釋一下插入時的情況,根據(jù)插入值的大小,逐步向下直到對應(yīng)的葉子節(jié)點。如果葉子節(jié)點關(guān)鍵字個數(shù)小于 2t,則直接插入值或者更新衛(wèi)星數(shù)據(jù);如果插入之前葉子節(jié)點已經(jīng)滿了,則分裂該葉子節(jié)點成兩半,并把中間值提上到父節(jié)點的關(guān)鍵字中,如果這導(dǎo)致父節(jié)點滿了的話,則把該父節(jié)點分裂,如此遞歸向上。所以樹高是一層層的增加的,葉子節(jié)點永遠都在同一深度。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 實現(xiàn)的后臺管理系統(tǒng) + 用戶小程序,支持 RBAC 動態(tài)權(quán)限、多租戶、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能

  • 項目地址:https://github.com/YunaiV/yudao-cloud
  • 視頻教程:https://doc.iocoder.cn/video/

小總結(jié)

  • 內(nèi)部節(jié)點并不存儲真正的信息,而是保存其葉子節(jié)點的最小值作為索引。
  • 每次插入刪除都進行更新(此時用到parent指針),保持最新狀態(tài)。
  • B+ 樹非葉子節(jié)點上是不存儲數(shù)據(jù)的,僅存儲鍵值
  • B+ 樹只在葉子節(jié)點上儲存“數(shù)據(jù)”,上層就會存儲更多的鍵值,相應(yīng)的樹的階數(shù)(節(jié)點的子節(jié)點樹)就會更大,樹就會更矮更胖,如此一來我們查找數(shù)據(jù)進行磁盤的 IO 次數(shù)又會再次減少,數(shù)據(jù)查詢的效率也會更快。
  • B+ 樹的階數(shù)是等于鍵值的數(shù)量的,如果我們的 B+ 樹一個節(jié)點可以存儲 1000 個鍵值,那么 3 層 B+ 樹可以存儲 1000×1000×1000=10 億個數(shù)據(jù)。
  • 一般根節(jié)點是常駐內(nèi)存的,所以一般我們查找 10 億數(shù)據(jù),只需要 2 次磁盤 IO。
  • 因為 B+ 樹索引的所有“數(shù)據(jù)”均存儲在葉子節(jié)點,而且數(shù)據(jù)是按照順序排列的。
  • 那么 B+ 樹使得范圍查找,排序查找,分組查找以及去重查找變得異常簡單
  • 有心的讀者可能還發(fā)現(xiàn)上圖 B+ 樹中各個頁之間是通過雙向鏈表連接的,葉子節(jié)點中的數(shù)據(jù)是通過單向鏈表連接的。
  • 其實上面的 B 樹我們也可以對各個節(jié)點加上鏈表。這些不是它們之前的區(qū)別,是因為在 MySQL 的 InnoDB 存儲引擎中,索引就是這樣存儲的。
  • 我們通過數(shù)據(jù)頁之間通過雙向鏈表連接以及葉子節(jié)點中數(shù)據(jù)之間通過單向鏈表連接的方式可以找到表中所有的數(shù)據(jù)。

結(jié)尾

感覺寫的有點啰嗦了 但是還是有點加深印象的 后續(xù)會接著整理一下相關(guān)的資料 補充進來

  • 如果你是直接跳到這里,看看文章有多長 建議收藏
  • 如果你一步步看到這里,感覺有點幫助 贊贊來一個
  • 如果感覺文章有問題,建議評論區(qū)指出 會修正

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6767

    瀏覽量

    88642
  • MySQL
    +關(guān)注

    關(guān)注

    1

    文章

    794

    瀏覽量

    26359

原文標題:圖解B+樹的生成過程!

文章出處:【微信號:芋道源碼,微信公眾號:芋道源碼】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人工智能大模型公司卓世科技完成億元B+輪融資

    近日,國內(nèi)領(lǐng)先的人工智能大模型解決方案提供商卓世科技宣布成功完成億元級B+輪融資,此輪融資由業(yè)界知名投資機構(gòu)同創(chuàng)偉業(yè)領(lǐng)投,同時吸引了青島國資平臺青島海發(fā)及啟迪之星等重量級機構(gòu)的跟投,彰顯了資本市場對卓世科技在人工智能領(lǐng)域創(chuàng)新實力及未來發(fā)展前景的高度認可。
    的頭像 發(fā)表于 08-13 17:50 ?546次閱讀

    壹沓科技完成B+輪融資,加速大供應(yīng)鏈超自動化進程

    近日,全球領(lǐng)先的數(shù)字員工機器人公司——壹沓科技宣布成功完成B+輪融資,此輪融資由鼎暉VGC(創(chuàng)新與成長基金)領(lǐng)投,新尚資本跟投,彰顯了資本市場對壹沓科技在大供應(yīng)鏈領(lǐng)域超自動化解決方案的高度認可與信心。
    的頭像 發(fā)表于 08-09 18:13 ?1258次閱讀

    地芯科技完成近億元B+輪融,加速高端模擬射頻芯片發(fā)展

    近日,國內(nèi)領(lǐng)先的高端模擬射頻芯片研發(fā)企業(yè)——地芯科技,宣布成功完成近億元的B+輪融資。本輪融資由鴻富資產(chǎn)、九智資本及鴻鵠致遠投資共同注資,標志著地芯科技在資本市場上的強勁勢頭和廣泛認可。
    的頭像 發(fā)表于 08-01 17:15 ?625次閱讀

    如何使用CubeMX生成的設(shè)備編譯鏡像?

    為什么只是增加一個串口要這么麻煩 如何使用CubeMX生成的設(shè)備編譯鏡像?請不要給我推官網(wǎng)的教程鏈接。官網(wǎng)相關(guān)的教程我都看了,并沒有一個完整敘述了從CubeMX設(shè)備生成鏡像的教程
    發(fā)表于 05-31 14:41

    北一半導(dǎo)體完成B+輪融資,用于SiC MOSFET技術(shù)研發(fā)

    北一半導(dǎo)體科技(廣東)有限公司近日宣布,已成功完成B+輪融資,預(yù)計本輪融資總額將突破至1.5億元。這筆融資資金的注入,將主要用于公司SiC MOSFET技術(shù)的深入研發(fā),以及現(xiàn)有產(chǎn)線的升級與擴建,以進一步鞏固和提升北一半導(dǎo)體的市場競爭力。
    的頭像 發(fā)表于 05-14 10:37 ?496次閱讀

    AI醫(yī)學(xué)影像企業(yè)深智透醫(yī)完成B+輪近千萬美元融資

    AI醫(yī)學(xué)影像領(lǐng)域的領(lǐng)軍企業(yè)深智透醫(yī)(Subtle Medical Inc.)近日成功完成了B+輪近千萬美元的融資,使其累計融資額超過五千萬美元。此次融資的注入,將為公司全球商業(yè)拓展和產(chǎn)品研發(fā)創(chuàng)新提供強大的資金支持。
    的頭像 發(fā)表于 05-14 10:08 ?393次閱讀

    北一半導(dǎo)體完成B+輪融資,推動SiC MOSFET產(chǎn)業(yè)化進程

    近日,北一半導(dǎo)體科技(廣東)有限公司成功完成了B+輪融資,標志著其碳化硅(SiC)MOSFET技術(shù)的產(chǎn)業(yè)化進程又邁出了堅實的一步。此次融資由上海吾同私募基金管理有限公司領(lǐng)投,總額達到1億元,另有5000萬元投資正進入收尾階段,預(yù)計本輪融資總額將高達1.5億元。
    的頭像 發(fā)表于 05-11 10:43 ?430次閱讀

    北一半導(dǎo)體完成B+輪1.5億元融資,加快SiC MOSFET技術(shù)研發(fā)

    半導(dǎo)體產(chǎn)業(yè)網(wǎng)獲悉:5月8日,北一半導(dǎo)體科技(廣東)有限公司(以下簡稱“北一半導(dǎo)體”)宣布其成功完成了B+輪融資。本輪融資資金將主要用于SiC MOSFET技術(shù)的進一步研發(fā),以及產(chǎn)線的升級與擴建。
    的頭像 發(fā)表于 05-10 10:43 ?691次閱讀
    北一半導(dǎo)體完成<b class='flag-5'>B+</b>輪1.5億元融資,加快SiC MOSFET技術(shù)研發(fā)

    音箱制作過程圖解

    電子發(fā)燒友網(wǎng)站提供《音箱制作過程圖解.doc》資料免費下載
    發(fā)表于 04-28 09:27 ?10次下載

    步進電機A+ A-有波形輸出,B+ B-沒有波形是什么原因?

    ,B+B-沒有,會是什么原因。 A+ ---》AOUT1 A- ---》AOUT2 B+ ---》BOUT1 B- ---》BOUT1
    發(fā)表于 04-18 07:30

    VCSEL光學(xué)解決方案提供商瑞識科技獲得近億元B+輪融資

    據(jù)麥姆斯咨詢報道,近日,VCSEL光學(xué)解決方案提供商瑞識科技獲得近億元B+輪融資。本輪投資方為廣汽資本、江淮汽車旗下產(chǎn)業(yè)資本和合肥產(chǎn)投,融資將繼續(xù)用于加速技術(shù)產(chǎn)品研發(fā)及量產(chǎn)落地。
    的頭像 發(fā)表于 03-22 09:33 ?484次閱讀

    新羿生物獲近1億元B+輪投資推動診療一體化發(fā)展

    北京新羿生物科技有限公司(以下簡稱:“新羿生物”)于近日成功完成近1億元人民幣B+輪融資。本輪融資由盛迪投資、禮來亞洲基金和九智資本共同投資。
    的頭像 發(fā)表于 02-25 09:09 ?1449次閱讀

    瓦特曼AI視覺企業(yè)先后完成數(shù)億元B輪和B+輪融資

    2023年12月,北京瓦特曼智能科技有限公司(以下簡稱“瓦特曼”或“WATTMAN“)先后完成數(shù)億元B輪和B+輪融資,由中國移動旗下北京中移數(shù)字新經(jīng)濟產(chǎn)業(yè)基金、國投證券相繼領(lǐng)投。
    的頭像 發(fā)表于 01-13 14:21 ?1489次閱讀

    光舵微納完成由國投創(chuàng)合投資的近億元B+輪股權(quán)融資

    據(jù)麥姆斯咨詢報道,近日,蘇州光舵微納科技股份有限公司(簡稱:光舵微納)完成由國投創(chuàng)合投資的近億元B+輪股權(quán)融資。
    的頭像 發(fā)表于 01-05 11:20 ?715次閱讀

    與二叉的定義

    型結(jié)構(gòu) 是一類重要的 非線性數(shù)據(jù)結(jié)構(gòu) ,其中以和二叉最為常用,直觀來看,是以分支關(guān)系定義的層次結(jié)構(gòu)。型結(jié)構(gòu)在客觀世界中廣泛存在,比
    的頭像 發(fā)表于 11-24 15:57 ?1171次閱讀
    <b class='flag-5'>樹</b>與二叉<b class='flag-5'>樹</b>的定義