0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你是否知道分庫分表需要哪些要素?

jf_ro2CN3Fa ? 來源:小姐姐味道 ? 作者:小姐姐養(yǎng)的狗 ? 2022-10-12 10:39 ? 次閱讀

數(shù)據(jù)庫中間件之分庫分表

切入層次

① 編碼層

② 框架層

③ 驅(qū)動層

④ 代理層

⑤ 實現(xiàn)層

驅(qū)動層和代理層對比

驅(qū)動層特點

代理層特點

共同點

使用限制

產(chǎn)品

流程解決方案

信息收集

前期準(zhǔn)備

實施階段

題外話

數(shù)據(jù)庫中間件之分庫分表

恭喜你,貴公司終于成長到一定規(guī)模,需要考慮高可用,甚至分庫分表了。但你是否知道分庫分表需要哪些要素?拆分過程是復(fù)雜的,提前計劃,不要等真正開工,各種意外的工作接踵而至,以至失控。

本文意圖打開數(shù)據(jù)庫中間件的廣度,而不考慮實現(xiàn)深度,至于庫表垂直和水平分的概念和緣由,不做過多解釋。所以此文面向的是有一定研發(fā)經(jīng)驗,正在尋找選型和拆分流程的專業(yè)人士。

基于 Spring Boot + MyBatis Plus + Vue & Element 實現(xiàn)的后臺管理系統(tǒng) + 用戶小程序,支持 RBAC 動態(tài)權(quán)限、多租戶、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能

切入層次

以下,范圍界定在JAVA和MySQL中。我們首先來看一下分庫分表切入的層次。

95a05bfe-49d2-11ed-a3b6-dac502259ad0.jpg

① 編碼層

在同一個項目中創(chuàng)建多個數(shù)據(jù)源,采用if else的方式,直接根據(jù)條件在代碼中路由。Spring中有動態(tài)切換數(shù)據(jù)源的抽象類,具體參見AbstractRoutingDataSource。

如果項目不是很龐大,使用這種方式能夠快速的進行分庫。但缺點也是顯而易見的,需要編寫大量的代碼,照顧到每個分支。當(dāng)涉及跨庫查詢、聚合,需要循環(huán)計算結(jié)果并合并的場景,工作量巨大。

如果項目裂變,此類代碼大多不能共用,大多通過拷貝共享。長此以往,碼將不碼。

② 框架層

這種情況適合公司ORM框架統(tǒng)一的情況,但在很多情況下不太現(xiàn)實。主要是修改或增強現(xiàn)有ORM框架的功能,在SQL中增加一些自定義原語或者hint來實現(xiàn)。

通過實現(xiàn)一些攔截器(比如Mybatis的Interceptor接口),增加一些自定義解析來控制數(shù)據(jù)的流向,效果雖然較好,但會改變一些現(xiàn)有的編程經(jīng)驗。

很多情況要修改框架源碼,不推薦。

③ 驅(qū)動層

基于在編碼層和框架層切入的各種缺點,真正的數(shù)據(jù)庫中間件起碼要從驅(qū)動層開始。什么意思呢?其實就是重新編寫了一個JDBC的驅(qū)動,在內(nèi)存中維護一個路由列表,然后將請求轉(zhuǎn)發(fā)到真正的數(shù)據(jù)庫連接中。

像TDDL、ShardingJDBC等,都是在此層切入。

包括Mysql Connector/J的Failover協(xié)議 (具體指“l(fā)oad balancing”、“replication”、“farbic”等), 也是直接在驅(qū)動上進行修改。

請求流向一般是這樣的:

95b44146-49d2-11ed-a3b6-dac502259ad0.jpg

④ 代理層

代理層的數(shù)據(jù)庫中間件,將自己偽裝成一個數(shù)據(jù)庫,接受業(yè)務(wù)端的鏈接。然后負載業(yè)務(wù)端的請求,解析或者轉(zhuǎn)發(fā)到真正的數(shù)據(jù)庫中。

像MySQL Router、MyCat等,都是在此層切入。

請求流向一般是這樣的:

95e0f178-49d2-11ed-a3b6-dac502259ad0.jpg

⑤ 實現(xiàn)層

SQL特殊版本支持,如Mysql cluster本身就支持各種特性,mariadb galera cluster支持對等雙主,Greenplum支持分片等。

需要換存儲,一般是解決方案,就不在討論之列了。

技術(shù)最終都會趨于一致,選擇任何一種、都是可行的。但最終選型,受開發(fā)人員熟悉度、社區(qū)活躍度、公司切合度、官方維護度、擴展性,以及公司現(xiàn)有的數(shù)據(jù)庫產(chǎn)品等多方位因素影響。選擇或開發(fā)一款合適的,小伙伴們會幸福很多。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 實現(xiàn)的后臺管理系統(tǒng) + 用戶小程序,支持 RBAC 動態(tài)權(quán)限、多租戶、數(shù)據(jù)權(quán)限、工作流、三方登錄、支付、短信、商城等功能

驅(qū)動層和代理層對比

通過以上層次描述,很明顯,我們選擇或開發(fā)中間件,就集中在驅(qū)動層和代理層。在這兩層,能夠?qū)?shù)據(jù)庫連接和路由進行更強的控制和更細致的管理。但它們的區(qū)別也是明顯的。

驅(qū)動層特點

僅支持JAVA,支持豐富的DB

驅(qū)動層中間件僅支持Java一種開發(fā)語言,但支持所有后端關(guān)系型數(shù)據(jù)庫。如果你的開發(fā)語言固定,后端數(shù)據(jù)源類型豐富,推薦使用此方案。

95fbbd28-49d2-11ed-a3b6-dac502259ad0.jpg

占用較多的數(shù)據(jù)庫連接

驅(qū)動層中間件要維護很多數(shù)據(jù)庫連接。比如一個分了10個 的表,每個java中的Connection要維護10個數(shù)據(jù)庫連接。如果項目過多,則會出現(xiàn)連接爆炸(我們算一下,如果每個項目6個實例,連接池中minIdle等于5,3個項目的連接總數(shù)是 10*6*5*3 = 900 個)。像Postgres這種每個連接對應(yīng)一個進程的數(shù)據(jù)庫,壓力會很大。

數(shù)據(jù)聚合在業(yè)務(wù)實例執(zhí)行

數(shù)據(jù)聚合,比如count sum等,是通過多次查詢,然后在業(yè)務(wù)實例的內(nèi)存中進行聚合。

路由表存在于業(yè)務(wù)方實例內(nèi)存中,通過輪詢或者被動通知的途徑更新路由表即可。

集中式管理

所有集群的配置管理都集中在一個地方,運維負擔(dān)小,DBA即可完成相關(guān)操作。

典型實現(xiàn)

961925f2-49d2-11ed-a3b6-dac502259ad0.jpg

代理層特點

異構(gòu)支持,DB支持有限

代理層中間件正好相反。僅支持一種后端關(guān)系型數(shù)據(jù)庫,但支持多種開發(fā)語言。如果你的系統(tǒng)是異構(gòu)的,并且都有同樣的SLA要求,則推薦使用此方案。

9624770e-49d2-11ed-a3b6-dac502259ad0.jpg

運維負擔(dān)大

代理層需要維護數(shù)據(jù)庫連接數(shù)量有限(MySQL Router那種粘性連接除外)。但作為一個獨立的服務(wù),既要考慮單獨部署,又要考慮高可用,會增加很多額外節(jié)點,更別提用了影子節(jié)點的公司了。另外,代理層是請求唯一的入口,穩(wěn)定性要求極高,一旦有高耗內(nèi)存的聚合查詢把節(jié)點搞崩潰了,都是災(zāi)難性的事故。

典型實現(xiàn)

96428bf4-49d2-11ed-a3b6-dac502259ad0.jpg

共同點

篇幅有限,不做過多討論。訪問各中間件宣傳頁面,能夠看到長長的Feature列表,也就是白名單;也能看到長長的限制列表,也就是黑名單。限定了你怎么玩,在增強了分布式能力后,分庫分表本身就是一個閹割的數(shù)據(jù)庫。

使用限制

確保數(shù)據(jù)均衡

拆分?jǐn)?shù)據(jù)庫的數(shù)據(jù)盡量均勻,比如按省份分user庫不均勻,按userid取模會比較均勻

不用深分頁

不帶切分鍵的深分頁,會取出所有庫所取頁數(shù)之前的所有數(shù)據(jù)在內(nèi)存排序計算。容易造成內(nèi)存溢出。

減少子查詢

子查詢會造成SQL解析紊亂,解析錯誤的情況,盡量減少SQL的子查詢。

事務(wù)最小原則

盡量縮小單機事務(wù)涉及的庫范圍,即盡可能減少夸庫操作,將同類操作的庫/表分在一起

數(shù)據(jù)均衡原則

拆分?jǐn)?shù)據(jù)庫的數(shù)據(jù)盡量均勻,比如按省份分user庫不均勻,按userid取模會比較均勻

特殊函數(shù)

distinct、having、union、in、or等,一般不被支持。或者被支持,使用之后會增加風(fēng)險,需要改造。

產(chǎn)品

建議聚焦在MyCat和ShardingJDBC上。另外,還有大量其他的中間件,不熟悉建議不要妄動。數(shù)據(jù)庫中間件不好維護,你會發(fā)現(xiàn)大量半死不活的項目。

以下列表,排名不分先后,有幾個是只有HA功能,沒有拆分功能的:

Atlas、Kingshard、DBProxy、mysql router、MaxScale、58 Oceanus、ArkProxy、Ctrip DAL、Tsharding、Youtube vitess、網(wǎng)易DDB、Heisenberg、proxysql、Mango、DDAL、Datahekr、MTAtlas、MTDDL、Zebra、Cobar、Cobar

汗、幾乎每個大廠都有自己的數(shù)據(jù)庫中間件(還發(fā)現(xiàn)了幾個喜歡拿開源組件加公司前綴作為產(chǎn)品的),只不過不給咱用罷了。

流程解決方案

無論是采用哪個層面切入進行分庫分表,都面臨以下工作過程。

966edc5e-49d2-11ed-a3b6-dac502259ad0.jpg

信息收集

統(tǒng)計影響的業(yè)務(wù)和項目

項目范圍越大,分庫難度越高。有時候,一句復(fù)雜的SQL能夠涉及四五個業(yè)務(wù)方,這種SQL都是需要重點關(guān)注的。

確定分庫分表的規(guī)模,是只分其中的幾張表,還是全部涉及。分的越多,工作量越大,幾乎是線性的。

還有一些項目是牽一發(fā)動全身的。舉個例子,下面這個過程,影響的鏈路就不僅是分庫這么簡單了。

9690062c-49d2-11ed-a3b6-dac502259ad0.jpg

確定參與人員

除了分庫分表組件的技術(shù)支持人員,最應(yīng)該參與的是對系統(tǒng)、對現(xiàn)有代碼最熟悉的幾個人。只有他們能夠確定哪些SQL該廢棄掉、SQL的影響面等。

確定分庫分表策略

確定分庫分表的維度和切分鍵。切分鍵(就是路由數(shù)據(jù)的column)一旦確定,是不允許修改的,所以在前期架構(gòu)設(shè)計上,應(yīng)該首先將其確立下來,才能進行后續(xù)的工作;數(shù)據(jù)維度多意味著有不同的切分鍵,達到不同條件查詢的效果。這涉及到數(shù)據(jù)的冗余(多寫、數(shù)據(jù)同步),會更加復(fù)雜。

前期準(zhǔn)備

數(shù)據(jù)規(guī)整

庫表結(jié)構(gòu)不滿足需求,需要提前規(guī)整。比如,切分鍵的字段名稱不同或者類型各異。在實施分庫分表策略時,這些個性會造成策略過大不好維護。

掃描所有SQL

將項目中所有的SQL掃描出來,逐個判斷是否能夠按照切分鍵正常運行。在判斷過程中肯定會有大量不合規(guī)的SQL,則都需要給出改造方案,這是主要的工作量之一。

驗證工具支持

直接在原有項目上進行改動和驗證是可行的,但會遇到諸多問題,主要是效率太低。我傾向于首先設(shè)計一些驗證工具,輸入要驗證的SQL或者列表,然后打印路由信息和結(jié)果進行判斷。

技術(shù)準(zhǔn)備

建議以下提到的各個點,都找一個例子體驗一下,然后根據(jù)自己的團隊預(yù)估難度。

以下:中間件所有不支持的SQL類型 整理容易造成崩潰的注意事項 不支持的SQL給出處理方式 考慮一個通用的主鍵生成器 考慮沒有切分鍵的SQL如何處理 考慮定時任務(wù)等掃全庫的如何進行遍歷 考慮跨庫跨表查詢?nèi)绾胃脑?準(zhǔn)備一些工具集

實施階段

數(shù)據(jù)遷移

分庫分表會重新影響數(shù)據(jù)的分布,無論是全量還是增量,都會涉及到數(shù)據(jù)遷移,所以Databus是必要的。

一種理想的狀態(tài)是所有的增刪改都是消息,可以通過訂閱MQ進行雙寫。

9698a782-49d2-11ed-a3b6-dac502259ad0.jpg

但一般情況下,仍然需要去模擬這個狀態(tài),比如使用Canal組件。

96b56ff2-49d2-11ed-a3b6-dac502259ad0.jpg

怎么保證數(shù)據(jù)安全的切換,我們分其他章節(jié)進行討論。

充足的測試

分庫分表必須經(jīng)過充足的測試,每一句SQL都要經(jīng)過嚴(yán)格的驗證。如果有單元測試或者自動化測試工具,完全的覆蓋是必要的。一旦有數(shù)據(jù)進行了錯誤的路由,尤其是增刪改,將會創(chuàng)造大量的麻煩。

在測試階段,將驗證過程輸出到單獨的日志文件,充足測試后review日志文件是否有錯誤的數(shù)據(jù)流向。

SQL復(fù)驗

強烈建議統(tǒng)一進行一次SQL復(fù)驗。主要是根據(jù)功能描述,確定SQL的正確性,也就是通常說的review。

演練

在非線上環(huán)境多次對方案進行演練,確保萬無一失。

制定新的SQL規(guī)范

分庫分表以后,項目中的SQL就加了枷鎖,不能夠隨意書寫了。很多平常支持的操作,在拆分環(huán)境下就可能運行不了了。所以在上線前,涉及的SQL都應(yīng)該有一個確認過程,即使已經(jīng)經(jīng)過了充足的測試。

題外話

沒有支持的活別接,干不成。

分庫分表是戰(zhàn)略性的技術(shù)方案,很多情況無法回退或者回退方案復(fù)雜。如果要拆分的庫表涉及多個業(yè)務(wù)方,公司技術(shù)人員復(fù)雜,CTO要親自掛帥進行協(xié)調(diào),并有專業(yè)仔細的架構(gòu)師進行監(jiān)督。沒有授權(quán)的協(xié)調(diào)人員會陷入尷尬的境地,導(dǎo)致流程失控項目難產(chǎn)。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • JDBC
    +關(guān)注

    關(guān)注

    0

    文章

    25

    瀏覽量

    13382
  • MYSQL數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    9372
  • DAL
    DAL
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    5387

原文標(biāo)題:設(shè)計糟糕的分庫分表是如何把系統(tǒng)搞掛的?

文章出處:【微信號:芋道源碼,微信公眾號:芋道源碼】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)庫分區(qū)、分庫

    今天先說說數(shù)據(jù)庫的數(shù)據(jù)分區(qū),分庫以及的內(nèi)容吧! 數(shù)據(jù)庫分區(qū)、分庫 數(shù)據(jù)庫分區(qū)、
    的頭像 發(fā)表于 09-30 11:24 ?2398次閱讀

    談分布式數(shù)據(jù)庫中間件之分庫   

      分庫,顧名思義就是把原本存儲于一個庫的數(shù)據(jù)分塊存儲到多個庫上,把原本存儲于一個的數(shù)據(jù)分塊存儲到多個上。那么關(guān)于
    發(fā)表于 08-02 20:19

    分庫是什么?怎么實現(xiàn)?

    數(shù)據(jù)庫分庫、讀寫分離的原理實現(xiàn),使用場景
    發(fā)表于 10-25 17:24

    關(guān)于 EMC 損失需要知道

    方程的一部。因此,在使用列線圖時不必使用頻率。知道需要12貝的衰減(就像以前一樣) ,
    發(fā)表于 06-18 14:42

    不用那么麻煩,從iPhone上就可以知道的電池是否需要更換

    有一種方法可以直接的了解的手機電池是否需要更換。iPhone系統(tǒng)需要在iOS10.2.1或以上才可以
    發(fā)表于 02-28 13:52 ?2.5w次閱讀

    利用Mycat實現(xiàn)MySQL讀寫分離、分庫最佳實踐

    利用Mycat實現(xiàn)MySQL讀寫分離、分庫最佳實踐
    發(fā)表于 09-08 10:20 ?14次下載
    利用Mycat實現(xiàn)MySQL讀寫分離、<b class='flag-5'>分庫</b><b class='flag-5'>分</b><b class='flag-5'>表</b>最佳實踐

    數(shù)據(jù)庫分庫基礎(chǔ)和實踐

    決上述問題?如果僅僅通過增加一個主實例來分擔(dān)寫請求,寫操作如何在兩個主實例之間同步來保證數(shù)據(jù)一致性,如何避免雙寫,問題會變的更加復(fù)雜。這時就需要用到分庫(sharding),對寫操
    發(fā)表于 09-05 16:40 ?237次閱讀

    你們知道為什么要分庫

    在文章開頭先拋幾個問題: (1)什么時候才需要分庫呢?我們的評判標(biāo)準(zhǔn)是什么? (2)一張存儲了多少數(shù)據(jù)的時候,才
    的頭像 發(fā)表于 08-16 10:37 ?1488次閱讀

    優(yōu)化MySQL數(shù)據(jù)庫中樸實無華的和花里胡哨的分庫

    4、水平分庫 總結(jié) 首先我們要知道分庫都是干啥的,本文主角還是我們的MySQL為第一視角。首先從字面意思來看:
    的頭像 發(fā)表于 08-26 16:33 ?1210次閱讀

    什么是分庫?為什么分庫?什么情況下會用分庫呢?

    分庫是由分庫這兩個獨立概念組成的,只不過通常分庫
    的頭像 發(fā)表于 11-30 09:37 ?6833次閱讀

    分庫的21條法則速來碼住(上)

    還是不著急實戰(zhàn),咱們先介紹下在分庫架構(gòu)實施過程中,會接觸到的一些通用概念,了解這些概念能夠幫助理解市面上其他的分庫表工具,盡管它們的實
    的頭像 發(fā)表于 05-26 17:33 ?511次閱讀
    <b class='flag-5'>分庫</b><b class='flag-5'>分</b><b class='flag-5'>表</b>的21條法則速來碼?。ㄉ希? />    </a>
</div>                            <div   id=

    分庫的21條法則速來碼住(下)

    還是不著急實戰(zhàn),咱們先介紹下在分庫架構(gòu)實施過程中,會接觸到的一些通用概念,了解這些概念能夠幫助理解市面上其他的分庫表工具,盡管它們的實
    的頭像 發(fā)表于 05-26 17:33 ?581次閱讀
    <b class='flag-5'>分庫</b><b class='flag-5'>分</b><b class='flag-5'>表</b>的21條法則速來碼?。ㄏ拢? />    </a>
</div>                            <div   id=

    如何知道的代碼是否線程安全

    的?如何知道的代碼是否線程安全?要如何訪問數(shù)據(jù)才能保證數(shù)據(jù)的安全? 本篇文章會一一回答的問題。 1. 線程不安全是怎樣的? 要搞清楚什么是線程安全,就要先了解線程不安全是什么樣的。
    的頭像 發(fā)表于 11-01 11:42 ?609次閱讀
    如何<b class='flag-5'>知道</b><b class='flag-5'>你</b>的代碼<b class='flag-5'>是否</b>線程安全

    分庫后復(fù)雜查詢的應(yīng)對之道:基于DTS實時性ES寬構(gòu)建技術(shù)實踐

    ,通過分庫應(yīng)對存系統(tǒng)讀寫性能瓶頸和存儲瓶頸;分庫
    的頭像 發(fā)表于 06-25 18:30 ?771次閱讀
    <b class='flag-5'>分庫</b><b class='flag-5'>分</b><b class='flag-5'>表</b>后復(fù)雜查詢的應(yīng)對之道:基于DTS實時性ES寬<b class='flag-5'>表</b>構(gòu)建技術(shù)實踐

    軟件系統(tǒng)數(shù)據(jù)庫的分庫設(shè)計

    軟件系統(tǒng)數(shù)據(jù)庫的分庫設(shè)計 系統(tǒng)讀寫分離、分庫技術(shù)實現(xiàn)采用MyCat中間件,MyCat 是
    的頭像 發(fā)表于 08-22 11:39 ?254次閱讀
    軟件系統(tǒng)數(shù)據(jù)庫的<b class='flag-5'>分庫</b><b class='flag-5'>分</b><b class='flag-5'>表</b>設(shè)計