0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MySQL 5.7并行復(fù)制實現(xiàn)原理與調(diào)優(yōu)

馬哥Linux運(yùn)維 ? 來源:tlsa.com ? 2022-12-23 14:52 ? 次閱讀

MySQL 5.7并行復(fù)制時代

眾所周知,MySQL的復(fù)制延遲是一直被詬病的問題之一,然而在Inside君之前的兩篇博客中(1,2)中都已經(jīng)提到了MySQL 5.7版本已經(jīng)支持“真正”的并行復(fù)制功能,官方稱為為enhanced multi-threaded slave(簡稱MTS),因此復(fù)制延遲問題已經(jīng)得到了極大的改進(jìn),甚至在Inside君所在的網(wǎng)易電商應(yīng)用中已經(jīng)完全消除了之前延遲長達(dá)幾小時的問題。然而,Inside君發(fā)現(xiàn)還是有很多小伙伴并不了解這個足以載入史冊的“偉大”的特性,故作分享??傊?,5.7版本后,復(fù)制延遲問題永不存在。

MySQL 5.6并行復(fù)制架構(gòu)

誠然,MySQL 5.6版本也支持所謂的并行復(fù)制,但是其并行只是基于schema的,也就是基于庫的。如果用戶的MySQL數(shù)據(jù)庫實例中存在多個schema,對于從機(jī)復(fù)制的速度的確可以有比較大的幫助。MySQL 5.6并行復(fù)制的架構(gòu)如下所示:

325f99e0-828c-11ed-8abf-dac502259ad0.png

在上圖的紅色框框部分就是實現(xiàn)并行復(fù)制的關(guān)鍵所在。在MySQL 5.6版本之前,Slave服務(wù)器上有兩個線程I/O線程和SQL線程。I/O線程負(fù)責(zé)接收二進(jìn)制日志(更準(zhǔn)確的說是二進(jìn)制日志的event),SQL線程進(jìn)行回放二進(jìn)制日志。如果在MySQL 5.6版本開啟并行復(fù)制功能,那么SQL線程就變?yōu)榱薱oordinator線程,coordinator線程主要負(fù)責(zé)以前兩部分的內(nèi)容:

若判斷可以并行執(zhí)行,那么選擇worker線程執(zhí)行事務(wù)的二進(jìn)制日志

若判斷不可以并行執(zhí)行,如該操作是DDL,亦或者是事務(wù)跨schema操作,則等待所有的worker線程執(zhí)行完成之后,再執(zhí)行當(dāng)前的日志 這意味著coordinator線程并不是僅將日志發(fā)送給worker線程,自己也可以回放日志,但是所有可以并行的操作交付由worker線程完成。coordinator線程與worker是典型的生產(chǎn)者與消費(fèi)者模型。

上述機(jī)制實現(xiàn)了基于schema的并行復(fù)制存在兩個問題,首先是crash safe功能不好做,因為可能之后執(zhí)行的事務(wù)由于并行復(fù)制的關(guān)系先完成執(zhí)行,那么當(dāng)發(fā)生crash的時候,這部分的處理邏輯是比較復(fù)雜的。從代碼上看,5.6這里引入了Low-Water-Mark標(biāo)記來解決該問題,從設(shè)計上看(WL#5569),其是希望借助于日志的冪等性來解決該問題,不過5.6的二進(jìn)制日志回放還不能實現(xiàn)冪等性。另一個最為關(guān)鍵的問題是這樣設(shè)計的并行復(fù)制效果并不高,如果用戶實例僅有一個庫,那么就無法實現(xiàn)并行回放,甚至性能會比原來的單線程更差。而單庫多表是比多庫多表更為常見的一種情形。

MySQL 5.7并行復(fù)制原理

MySQL 5.7基于組提交的并行復(fù)制

MySQL 5.7才可稱為真正的并行復(fù)制,這其中最為主要的原因就是slave服務(wù)器的回放與主機(jī)是一致的即master服務(wù)器上是怎么并行執(zhí)行的slave上就怎樣進(jìn)行并行回放。不再有庫的并行復(fù)制限制,對于二進(jìn)制日志格式也無特殊的要求(基于庫的并行復(fù)制也沒有要求)。

從MySQL官方來看,其并行復(fù)制的原本計劃是支持表級的并行復(fù)制和行級的并行復(fù)制,行級的并行復(fù)制通過解析ROW格式的二進(jìn)制日志的方式來完成,WL#4648。但是最終出現(xiàn)給小伙伴的確是在開發(fā)計劃中稱為:MTS: Prepared transactions slave parallel applier,可見:WL#6314。該并行復(fù)制的思想最早是由MariaDB的Kristain提出,并已在MariaDB 10中出現(xiàn),相信很多選擇MariaDB的小伙伴最為看重的功能之一就是并行復(fù)制。

MySQL 5.7并行復(fù)制的思想簡單易懂,一言以蔽之:一個組提交的事務(wù)都是可以并行回放,因為這些事務(wù)都已進(jìn)入到事務(wù)的prepare階段,則說明事務(wù)之間沒有任何沖突(否則就不可能提交)。

為了兼容MySQL 5.6基于庫的并行復(fù)制,5.7引入了新的變量slave-parallel-type,其可以配置的值有:

DATABASE:默認(rèn)值,基于庫的并行復(fù)制方式

LOGICAL_CLOCK:基于組提交的并行復(fù)制方式

支持并行復(fù)制的GTID

如何知道事務(wù)是否在一組中,又是一個問題,因為原版的MySQL并沒有提供這樣的信息。在MySQL 5.7版本中,其設(shè)計方式是將組提交的信息存放在GTID中。那么如果用戶沒有開啟GTID功能,即將參數(shù)gtid_mode設(shè)置為OFF呢?故MySQL 5.7又引入了稱之為Anonymous_Gtid的二進(jìn)制日志event類型,如:

mysql>SHOWBINLOGEVENTSin'mysql-bin.000006';
+------------------+-----+----------------+-----------+-------------+-----------------------------------------------+
|Log_name|Pos|Event_type|Server_id|End_log_pos|Info|
+------------------+-----+----------------+-----------+-------------+-----------------------------------------------+
|mysql-bin.000006|4|Format_desc|88|123|Serverver:5.7.7-rc-debug-log,Binlogver:4|
|mysql-bin.000006|123|Previous_gtids|88|194|f11232f7-ff07-11e4-8fbb-00ff55e152c6:1-2|
|mysql-bin.000006|194|Anonymous_Gtid|88|259|SET@@SESSION.GTID_NEXT='ANONYMOUS'|
|mysql-bin.000006|259|Query|88|330|BEGIN|
|mysql-bin.000006|330|Table_map|88|373|table_id:108(aaa.t)|
|mysql-bin.000006|373|Write_rows|88|413|table_id:108flags:STMT_END_F|
.....

這意味著在MySQL 5.7版本中即使不開啟GTID,每個事務(wù)開始前也是會存在一個Anonymous_Gtid,而這GTID中就存在著組提交的信息。

LOGICAL_CLOCK

然而,通過上述的SHOW BINLOG EVENTS,我們并沒有發(fā)現(xiàn)有關(guān)組提交的任何信息。但是通過mysqlbinlog工具,用戶就能發(fā)現(xiàn)組提交的內(nèi)部信息:

root@localhost:~#mysqlbinlogmysql-bin.0000006|greplast_committed
#1505201411serverid88end_log_pos259CRC320x4ead9ad6GTIDlast_committed=0sequence_number=1
#1505201411serverid88end_log_pos1483CRC320xdf94bc85GTIDlast_committed=0sequence_number=2
#1505201411serverid88end_log_pos2708CRC320x0914697bGTIDlast_committed=0sequence_number=3
#1505201411serverid88end_log_pos3934CRC320xd9cb4a43GTIDlast_committed=0sequence_number=4
#1505201411serverid88end_log_pos5159CRC320x06a6f531GTIDlast_committed=0sequence_number=5
#1505201411serverid88end_log_pos6386CRC320xd6cae930GTIDlast_committed=0sequence_number=6
#1505201411serverid88end_log_pos7610CRC320xa1ea531cGTIDlast_committed=6sequence_number=7
...

可以發(fā)現(xiàn)較之原來的二進(jìn)制日志內(nèi)容多了last_committed和sequence_number,last_committed表示事務(wù)提交的時候,上次事務(wù)提交的編號,如果事務(wù)具有相同的last_committed,表示這些事務(wù)都在一組內(nèi),可以進(jìn)行并行的回放。例如上述last_committed為0的事務(wù)有6個,表示組提交時提交了6個事務(wù),而這6個事務(wù)在從機(jī)是可以進(jìn)行并行回放的。

上述的last_committed和sequence_number代表的就是所謂的LOGICAL_CLOCK。先來看源碼中對于LOGICAL_CLOCK的定義:

classLogical_clock
{
private:
int64state;
/*
Offsetissubtractedfromtheactual"absolutetime"valueat
loggingareplicationevent.Thatistheeventholdslogical
timestampsinthe"relative"format.Theyaremeaningfulonlyin
thecontextofthecurrentbinlog.
Thememberisupdated(incremented)perbinarylogrotation.
*/
int64offset;
......

state是一個自增的值,offset在每次二進(jìn)制日志發(fā)生rotate時更新,記錄發(fā)生rotate時的state值。其實state和offset記錄的是全局的計數(shù)值,而存在二進(jìn)制日志中的僅是當(dāng)前文件的相對值。使用LOGICAL_CLOCK的場景如下:

classMYSQL_BIN_LOG:publicTC_LOG
{
...
public:
/*Committedtransactionstimestamp*/
Logical_clockmax_committed_transaction;
/*"Prepared"transactionstimestamp*/
Logical_clocktransaction_counter;
...

可以看到在類MYSQL_BIN_LOG中定義了兩個Logical_clock的變量:

max_c ommitted_transaction:記錄上次組提交時的logical_clock,代表上述mysqlbinlog中的last_committed

transaction_counter:記錄當(dāng)前組提交中各事務(wù)的logcial_clock,代表上述mysqlbinlog中的sequence_number

并行復(fù)制測試

下圖顯示了開啟MTS后,slave服務(wù)器的QPS。測試的工具是sysbench的單表全update測試,測試結(jié)果顯示在16個線程下的性能最好,從機(jī)的QPS可以達(dá)到25000以上,進(jìn)一步增加并行執(zhí)行的線程至32并沒有帶來更高的提升。而原單線程回放的QPS僅在4000左右,可見MySQL 5.7 MTS帶來的性能提升,而由于測試的是單表,所以MySQL 5.6的MTS機(jī)制則完全無能為力了。

327667e2-828c-11ed-8abf-dac502259ad0.jpg

并行復(fù)制配置與調(diào)優(yōu)

master_info_repository

開啟MTS功能后,務(wù)必將參數(shù)master_info_repostitory設(shè)置為TABLE,這樣性能可以有50%~80%的提升。這是因為并行復(fù)制開啟后對于元master.info這個文件的更新將會大幅提升,資源的競爭也會變大。在之前InnoSQL的版本中,添加了參數(shù)來控制刷新master.info這個文件的頻率,甚至可以不刷新這個文件。因為刷新這個文件是沒有必要的,即根據(jù)master-info.log這個文件恢復(fù)本身就是不可靠的。在MySQL 5.7中,Inside君推薦將master_info_repository設(shè)置為TABLE,來減小這部分的開銷。

slave_parallel_workers

若將slave_parallel_workers設(shè)置為0,則MySQL 5.7退化為原單線程復(fù)制,但將slave_parallel_workers設(shè)置為1,則SQL線程功能轉(zhuǎn)化為coordinator線程,但是只有1個worker線程進(jìn)行回放,也是單線程復(fù)制。然而,這兩種性能卻又有一些的區(qū)別,因為多了一次coordinator線程的轉(zhuǎn)發(fā),因此slave_parallel_workers=1的性能反而比0還要差,在Inside君的測試下還有20%左右的性能下降,如下圖所示:

328569e0-828c-11ed-8abf-dac502259ad0.jpg

這里其中引入了另一個問題,如果主機(jī)上的負(fù)載不大,那么組提交的效率就不高,很有可能發(fā)生每組提交的事務(wù)數(shù)量僅有1個,那么在從機(jī)的回放時,雖然開啟了并行復(fù)制,但會出現(xiàn)性能反而比原先的單線程還要差的現(xiàn)象,即延遲反而增大了。聰明的小伙伴們,有想過對這個進(jìn)行優(yōu)化嗎?

Enhanced Multi-Threaded Slave配置

說了這么多,要開啟enhanced multi-threaded slave其實很簡單,只需根據(jù)如下設(shè)置:

#slave
slave-parallel-type=LOGICAL_CLOCK
slave-parallel-workers=16
master_info_repository=TABLE
relay_log_info_repository=TABLE
relay_log_recovery=ON

并行復(fù)制監(jiān)控 復(fù)制的監(jiān)控依舊可以通過SHOW SLAVE STATUSG,但是MySQL 5.7在performance_schema架構(gòu)下多了以下這些元數(shù)據(jù)表,用戶可以更細(xì)力度的進(jìn)行監(jiān)控:

mysql>showtableslike'replication%';
+---------------------------------------------+
|Tables_in_performance_schema(replication%)|
+---------------------------------------------+
|replication_applier_configuration|
|replication_applier_status|
|replication_applier_status_by_coordinator|
|replication_applier_status_by_worker|
|replication_connection_configuration|
|replication_connection_status|
|replication_group_member_stats|
|replication_group_members|
+---------------------------------------------+
8rowsinset(0.00sec)

總結(jié)

MySQL 5.7推出的Enhanced Multi-Threaded Slave解決了困擾MySQL長達(dá)數(shù)十年的復(fù)制延遲問題,再次提醒一些無知的PostgreSQL用戶,不要停留在之前對于MySQL的印象,物理復(fù)制也不一定肯定比邏輯復(fù)制有優(yōu)勢,而MySQL 5.7的MTS已經(jīng)完全可以解決延遲問題了。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SQL
    SQL
    +關(guān)注

    關(guān)注

    1

    文章

    751

    瀏覽量

    43990
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3739

    瀏覽量

    64174
  • MySQL
    +關(guān)注

    關(guān)注

    1

    文章

    794

    瀏覽量

    26355
收藏 人收藏

    評論

    相關(guān)推薦

    怎么簡單實現(xiàn)由Labview讀取的串口數(shù)據(jù)自增寫入mysql5.7數(shù)據(jù)庫中?

    怎么簡單實現(xiàn)由Labview讀取的串口數(shù)據(jù)自增寫入mysql5.7數(shù)據(jù)庫中? 已實現(xiàn):串口數(shù)據(jù)的接收處理 mysql5.7的安裝(已測試數(shù)據(jù)庫正常運(yùn)行) 愿付費(fèi)解決此問題(QQ:8
    發(fā)表于 01-11 22:05

    0基礎(chǔ)學(xué)Mysql:mysql入門視頻教程!

    的性能調(diào)優(yōu)技術(shù)掌握基于MySQL的架構(gòu)設(shè)計方案課程目錄:第1節(jié) MySQL課程介紹和MySQL的基礎(chǔ)概念(1)第2節(jié)
    發(fā)表于 07-08 10:51

    MySQL的幾種復(fù)制配置

    MySQL主從復(fù)制、主主復(fù)制、雙主多從配置
    發(fā)表于 04-16 09:50

    mysql的主從復(fù)制

    mysql 主從復(fù)制
    發(fā)表于 04-28 14:30

    如何對電機(jī)進(jìn)行調(diào)優(yōu)?調(diào)優(yōu)的好處是什么?

    如何自動對電機(jī)進(jìn)行調(diào)優(yōu)
    的頭像 發(fā)表于 08-22 00:03 ?3061次閱讀

    虛擬機(jī):CentOS 7安裝MySQL5.7的步驟

    虛擬機(jī):CentOS 7安裝MySQL5.7的步驟
    的頭像 發(fā)表于 07-02 18:00 ?3157次閱讀

    MySQL 5.7MySQL 8.0 性能對比

    背景 測試mysql5.7mysql8.0分別在讀寫,選定,只寫模式下不同并發(fā)時的性能(tps,qps) 最早 測試使用版本為mysql5.7.22和mysql8.0.15 sysb
    的頭像 發(fā)表于 11-03 09:26 ?1.6w次閱讀
    <b class='flag-5'>MySQL</b> <b class='flag-5'>5.7</b>與<b class='flag-5'>MySQL</b> 8.0 性能對比

    KeenOpt調(diào)優(yōu)算法框架實現(xiàn)對調(diào)優(yōu)對象和配套工具的快速適配

    今天, KeenTune 再次帶來開源重磅特性——新增通用的調(diào)優(yōu)算法框架:keenopt。有了 keenopt 的加持,KeenTune 不再僅僅是支持靈活擴(kuò)展調(diào)優(yōu)場景的
    的頭像 發(fā)表于 11-11 09:31 ?715次閱讀

    MySQL 5.6并行復(fù)制架構(gòu)及并行復(fù)制原理

    ySQL 5.6版本也支持所謂的并行復(fù)制,但是其并行只是基于schema的,也就是基于庫的。如果用戶的MySQL數(shù)據(jù)庫實例中存在多個schema,對于從機(jī)復(fù)制的速度的確可以有比較大的幫
    發(fā)表于 12-23 14:52 ?489次閱讀

    探討MySQL復(fù)制機(jī)制實現(xiàn)的方式

    MySQL Replication(主從復(fù)制)是指數(shù)據(jù)變化可以從一個MySQL Server被復(fù)制到另一個或多個MySQL Server上,
    的頭像 發(fā)表于 04-12 09:29 ?622次閱讀

    mysql如何實現(xiàn)主從復(fù)制的具體流程

    主從復(fù)制MySQL數(shù)據(jù)庫中常用的數(shù)據(jù)復(fù)制技術(shù)之一,它的主要目的是將一個數(shù)據(jù)庫服務(wù)器上的數(shù)據(jù)復(fù)制到其他服務(wù)器上,以實現(xiàn)數(shù)據(jù)的備份、高可用和分
    的頭像 發(fā)表于 11-16 14:10 ?678次閱讀

    mysql主從復(fù)制主要有幾種模式

    MySQL主從復(fù)制MySQL數(shù)據(jù)庫中常用的一種數(shù)據(jù)復(fù)制方式,用于實現(xiàn)數(shù)據(jù)的備份、負(fù)載均衡、故障恢復(fù)等目的。主從
    的頭像 發(fā)表于 11-16 14:15 ?1098次閱讀

    mysql主從復(fù)制的原理

    MySQL主從復(fù)制是一種數(shù)據(jù)庫復(fù)制技術(shù),它允許將一個MySQL數(shù)據(jù)庫的更新操作自動復(fù)制到其他MySQL
    的頭像 發(fā)表于 11-16 14:18 ?434次閱讀

    mysql主從復(fù)制 混合類型的復(fù)制

    MySQL主從復(fù)制是一種常用的數(shù)據(jù)復(fù)制技術(shù),可以實現(xiàn)數(shù)據(jù)從一個MySQL服務(wù)器(主服務(wù)器)復(fù)制
    的頭像 發(fā)表于 11-16 14:20 ?501次閱讀

    配置MySQL主從復(fù)制和讀寫分離

    配置MySQL主從復(fù)制和讀寫分離
    的頭像 發(fā)表于 10-23 11:44 ?91次閱讀
    配置<b class='flag-5'>MySQL</b>主從<b class='flag-5'>復(fù)制</b>和讀寫分離