0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹4種常用的MySQL同步ES方案

jf_ro2CN3Fa ? 來(lái)源:樓仔 ? 2023-11-20 10:45 ? 次閱讀

1. 前言

在實(shí)際項(xiàng)目開(kāi)發(fā)中,我們經(jīng)常將 MySQL 作為業(yè)務(wù)數(shù)據(jù)庫(kù),ES 作為查詢數(shù)據(jù)庫(kù),用來(lái)實(shí)現(xiàn)讀寫(xiě)分離,緩解 MySQL 數(shù)據(jù)庫(kù)的查詢壓力,應(yīng)對(duì)海量數(shù)據(jù)的復(fù)雜查詢。

這其中有一個(gè)很重要的問(wèn)題,就是如何實(shí)現(xiàn) MySQL 數(shù)據(jù)庫(kù)和 ES 的數(shù)據(jù)同步,今天和大家聊聊 MySQL 和 ES 數(shù)據(jù)同步的各種方案。

我們先看看下面 4 種常用的數(shù)據(jù)同步方案。

2. 數(shù)據(jù)同步方案

2.1 同步雙寫(xiě)

這是一種最為簡(jiǎn)單的方式,在將數(shù)據(jù)寫(xiě)到 MySQL 時(shí),同時(shí)將數(shù)據(jù)寫(xiě)到 ES。

fd5f81fc-8748-11ee-939d-92fbcf53809c.png

優(yōu)點(diǎn):

業(yè)務(wù)邏輯簡(jiǎn)單;

實(shí)時(shí)性高。

缺點(diǎn):

硬編碼,有需要寫(xiě)入 MySQL 的地方都需要添加寫(xiě)入 ES 的代碼;

業(yè)務(wù)強(qiáng)耦合;

存在雙寫(xiě)失敗丟數(shù)據(jù)風(fēng)險(xiǎn);

性能較差,本來(lái) MySQL 的性能不是很高,再加一個(gè) ES,系統(tǒng)的性能必然會(huì)下降。

2.2 異步雙寫(xiě)

針對(duì)多數(shù)據(jù)源寫(xiě)入的場(chǎng)景,可以借助 MQ 實(shí)現(xiàn)異步的多源寫(xiě)入。

fd7a5838-8748-11ee-939d-92fbcf53809c.png

優(yōu)點(diǎn):

性能高;

不易出現(xiàn)數(shù)據(jù)丟失問(wèn)題,主要基于 MQ 消息的消費(fèi)保障機(jī)制,比如 ES 宕機(jī)或者寫(xiě)入失敗,還能重新消費(fèi) MQ 消息;

多源寫(xiě)入之間相互隔離,便于擴(kuò)展更多的數(shù)據(jù)源寫(xiě)入。

缺點(diǎn):

硬編碼問(wèn)題,接入新的數(shù)據(jù)源需要實(shí)現(xiàn)新的消費(fèi)者代碼;

系統(tǒng)復(fù)雜度增加,引入了消息中間件;

MQ是異步消費(fèi)模型,用戶寫(xiě)入的數(shù)據(jù)不一定可以馬上看到,造成延時(shí)。

2.3 基于 SQL 抽取

上面兩種方案中都存在硬編碼問(wèn)題,代碼的侵入性太強(qiáng),如果對(duì)實(shí)時(shí)性要求不高的情況下,可以考慮用定時(shí)器來(lái)處理:

數(shù)據(jù)庫(kù)的相關(guān)表中增加一個(gè)字段為 timestamp 的字段,任何 CURD 操作都會(huì)導(dǎo)致該字段的時(shí)間發(fā)生變化;

原來(lái)程序中的 CURD 操作不做任何變化;

增加一個(gè)定時(shí)器程序,讓該程序按一定的時(shí)間周期掃描指定的表,把該時(shí)間段內(nèi)發(fā)生變化的數(shù)據(jù)提取出來(lái);

逐條寫(xiě)入到 ES 中。

fd8737d8-8748-11ee-939d-92fbcf53809c.png

優(yōu)點(diǎn):

不改變?cè)瓉?lái)代碼,沒(méi)有侵入性、沒(méi)有硬編碼;

沒(méi)有業(yè)務(wù)強(qiáng)耦合,不改變?cè)瓉?lái)程序的性能;

Worker 代碼編寫(xiě)簡(jiǎn)單不需要考慮增刪改查。

缺點(diǎn):

時(shí)效性較差,由于是采用定時(shí)器根據(jù)固定頻率查詢表來(lái)同步數(shù)據(jù),盡管將同步周期設(shè)置到秒級(jí),也還是會(huì)存在一定時(shí)間的延遲;

對(duì)數(shù)據(jù)庫(kù)有一定的輪詢壓力,一種改進(jìn)方法是將輪詢放到壓力不大的從庫(kù)上。

經(jīng)典方案:借助 Logstash 實(shí)現(xiàn)數(shù)據(jù)同步,其底層實(shí)現(xiàn)原理就是根據(jù)配置定期使用 SQL 查詢新增的數(shù)據(jù)寫(xiě)入 ES 中,實(shí)現(xiàn)數(shù)據(jù)的增量同步。

2.4 基于 Binlog 實(shí)時(shí)同步

上面三種方案要么有代碼侵入,要么有硬編碼,要么有延遲,那么有沒(méi)有一種方案既能保證數(shù)據(jù)同步的實(shí)時(shí)性又沒(méi)有代入侵入呢?

當(dāng)然有,可以利用 MySQL 的 Binlog 來(lái)進(jìn)行同步。

fd981472-8748-11ee-939d-92fbcf53809c.png

具體步驟如下:

讀取 MySQL 的 Binlog 日志,獲取指定表的日志信息

將讀取的信息轉(zhuǎn)為 MQ;

編寫(xiě)一個(gè) MQ 消費(fèi)程序;

不斷消費(fèi) MQ,每消費(fèi)完一條消息,將消息寫(xiě)入到 ES 中。

優(yōu)點(diǎn):

沒(méi)有代碼侵入、沒(méi)有硬編碼;

原有系統(tǒng)不需要任何變化,沒(méi)有感知;

性能高;

業(yè)務(wù)解耦,不需要關(guān)注原來(lái)系統(tǒng)的業(yè)務(wù)邏輯。

缺點(diǎn):

構(gòu)建 Binlog 系統(tǒng)復(fù)雜;

如果采用 MQ 消費(fèi)解析的 Binlog 信息,也會(huì)像方案二一樣存在 MQ 延時(shí)的風(fēng)險(xiǎn)。

3. 數(shù)據(jù)遷移工具選型

對(duì)于上面 4 種數(shù)據(jù)同步方案,“基于 Binlog 實(shí)時(shí)同步”方案是目前最常用的,也誕生了很多優(yōu)秀的數(shù)據(jù)遷移工具,這里主要對(duì)這些遷移工具進(jìn)行介紹。

這些數(shù)據(jù)遷移工具,很多都是基于 Binlog 訂閱的方式實(shí)現(xiàn),模擬一個(gè) MySQL Slave 訂閱 Binlog 日志,從而實(shí)現(xiàn) CDC (Change Data Capture),將已提交的更改發(fā)送到下游,包括 INSERT、DELETE、UPDATE。

至于如何偽裝?大家需要先了解 MySQL 的主從復(fù)制原理,需要學(xué)習(xí)這塊知識(shí)的同學(xué),可以看我之前寫(xiě)的高并發(fā)教程,里面有詳細(xì)講解。

3.1 Cannel

基于數(shù)據(jù)庫(kù)增量日志解析,提供增量數(shù)據(jù)訂閱&消費(fèi),目前主要支持 MySQL。

Canal 原理就是偽裝成 MySQL 的從節(jié)點(diǎn),從而訂閱 master 節(jié)點(diǎn)的 Binlog 日志,主要流程為:

Canal 服務(wù)端向 MySQL 的 master 節(jié)點(diǎn)傳輸 dump 協(xié)議;

MySQL 的 master 節(jié)點(diǎn)接收到 dump 請(qǐng)求后推送 Binlog 日志給 Canal 服務(wù)端,解析 Binlog 對(duì)象(原始為 byte 流)轉(zhuǎn)成 Json 格式;

Canal 客戶端通過(guò) TCP 協(xié)議或 MQ 形式監(jiān)聽(tīng) Canal 服務(wù)端,同步數(shù)據(jù)到 ES。

fda32ec0-8748-11ee-939d-92fbcf53809c.png

下面是 Cannel 執(zhí)行的核心流程,其中 Binlog Parser 主要負(fù)責(zé) Binlog 的提取、解析和推送,EventSink 負(fù)責(zé)數(shù)據(jù)的過(guò)濾 、路由和加工,僅作了解即可。

fdc3d328-8748-11ee-939d-92fbcf53809c.png

3.2 阿里云 DTS

數(shù)據(jù)傳輸服務(wù) DTS(Data Transmission Service)支持 RDBMS、NoSQL、OLAP 等多種數(shù)據(jù)源之間的數(shù)據(jù)傳輸。

它提供了數(shù)據(jù)遷移、實(shí)時(shí)數(shù)據(jù)訂閱及數(shù)據(jù)實(shí)時(shí)同步等多種數(shù)據(jù)傳輸方式。相對(duì)于第三方數(shù)據(jù)流工具,DTS 提供豐富多樣、高性能、高安全可靠的傳輸鏈路,同時(shí)它提供了諸多便利功能,極大方便了傳輸鏈路的創(chuàng)建及管理。

特點(diǎn):

多數(shù)據(jù)源:支持 RDBMS、NoSQL、OLAP 等多種數(shù)據(jù)源間的數(shù)據(jù)傳輸;

多傳輸方式:支持多種傳輸方式,包括數(shù)據(jù)遷移、實(shí)時(shí)數(shù)據(jù)訂閱及數(shù)據(jù)實(shí)時(shí)同步;

高性能:底層采用了多種性能優(yōu)化措施,全量數(shù)據(jù)遷移高峰期時(shí)性能可以達(dá)到70MB/s,20萬(wàn)的TPS,使用高規(guī)格服務(wù)器來(lái)保證每條遷移或同步鏈路都能擁有良好的傳輸性能;

高可用:底層為服務(wù)集群,如果集群內(nèi)任何一個(gè)節(jié)點(diǎn)宕機(jī)或發(fā)生故障,控制中心都能夠?qū)⑦@個(gè)節(jié)點(diǎn)上的所有任務(wù)快速切換到其他節(jié)點(diǎn)上,鏈路穩(wěn)定性高;

簡(jiǎn)單易用:提供可視化管理界面,提供向?qū)降逆溌穭?chuàng)建流程,用戶可以在其控制臺(tái)簡(jiǎn)單輕松地創(chuàng)建傳輸鏈路;

需要付費(fèi)。

再看看 DTS 的系統(tǒng)架構(gòu)。

fdd2349a-8748-11ee-939d-92fbcf53809c.png

高可用:數(shù)據(jù)傳輸服務(wù)內(nèi)部每個(gè)模塊都有主備架構(gòu),保證系統(tǒng)高可用。容災(zāi)系統(tǒng)實(shí)時(shí)檢測(cè)每個(gè)節(jié)點(diǎn)的健康狀況,一旦發(fā)現(xiàn)某個(gè)節(jié)點(diǎn)異常,會(huì)將鏈路快速切換到其他節(jié)點(diǎn)。

數(shù)據(jù)源地址動(dòng)態(tài)適配:對(duì)于數(shù)據(jù)訂閱及同步鏈路,容災(zāi)系統(tǒng)還會(huì)監(jiān)測(cè)數(shù)據(jù)源的連接地址切換等變更操作,一旦發(fā)現(xiàn)數(shù)據(jù)源發(fā)生連接地址變更,它會(huì)動(dòng)態(tài)適配數(shù)據(jù)源新的連接方式,在數(shù)據(jù)源變更的情況下,保證鏈路的穩(wěn)定性。

3.3 Databus

Databus 是一個(gè)低延遲、可靠的、支持事務(wù)的、保持一致性的數(shù)據(jù)變更抓取系統(tǒng)。由 LinkedIn 于 2013 年開(kāi)源。

Databus 通過(guò)挖掘數(shù)據(jù)庫(kù)日志的方式,將數(shù)據(jù)庫(kù)變更實(shí)時(shí)、可靠的從數(shù)據(jù)庫(kù)拉取出來(lái),業(yè)務(wù)可以通過(guò)定制化 client 實(shí)時(shí)獲取變更并進(jìn)行其他業(yè)務(wù)邏輯。

特點(diǎn):

多數(shù)據(jù)源:Databus 支持多種數(shù)據(jù)來(lái)源的變更抓取,包括 Oracle 和 MySQL。

可擴(kuò)展、高度可用:Databus 能擴(kuò)展到支持?jǐn)?shù)千消費(fèi)者和事務(wù)數(shù)據(jù)來(lái)源,同時(shí)保持高度可用性。

事務(wù)按序提交:Databus 能保持來(lái)源數(shù)據(jù)庫(kù)中的事務(wù)完整性,并按照事務(wù)分組和來(lái)源的提交順尋交付變更事件。

低延遲、支持多種訂閱機(jī)制:數(shù)據(jù)源變更完成后,Databus 能在毫秒級(jí)內(nèi)將事務(wù)提交給消費(fèi)者。同時(shí),消費(fèi)者使用D atabus 中的服務(wù)器端過(guò)濾功能,可以只獲取自己需要的特定數(shù)據(jù)。

無(wú)限回溯:對(duì)消費(fèi)者支持無(wú)限回溯能力,例如當(dāng)消費(fèi)者需要產(chǎn)生數(shù)據(jù)的完整拷貝時(shí),它不會(huì)對(duì)數(shù)據(jù)庫(kù)產(chǎn)生任何額外負(fù)擔(dān)。當(dāng)消費(fèi)者的數(shù)據(jù)大大落后于來(lái)源數(shù)據(jù)庫(kù)時(shí),也可以使用該功能。

再看看 Databus 的系統(tǒng)架構(gòu)。

Databus 由 Relays、bootstrap 服務(wù)和 Client lib 等組成,Bootstrap 服務(wù)中包括 Bootstrap Producer 和 Bootstrap Server。

fde5760e-8748-11ee-939d-92fbcf53809c.png

快速變化的消費(fèi)者直接從 Relay 中取事件;

如果一個(gè)消費(fèi)者的數(shù)據(jù)更新大幅落后,它要的數(shù)據(jù)就不在 Relay 的日志中,而是需要請(qǐng)求 Bootstrap 服務(wù),返回的將會(huì)是自消費(fèi)者上次處理變更之后的所有數(shù)據(jù)變更快照。

3.4 其它

Flink

有界數(shù)據(jù)流和無(wú)界數(shù)據(jù)流上進(jìn)行有狀態(tài)計(jì)算分布式處理引擎和框架。

CloudCanal

數(shù)據(jù)同步遷移系統(tǒng),商業(yè)產(chǎn)品。

Maxwell

使用簡(jiǎn)單,直接將數(shù)據(jù)變更輸出為json字符串,不需要再編寫(xiě)客戶端。

DRD

阿里巴巴集團(tuán)自主研發(fā)的分布式數(shù)據(jù)庫(kù)中間件產(chǎn)品,專注于解決單機(jī)關(guān)系型數(shù)據(jù)庫(kù)擴(kuò)展性問(wèn)題,具備輕量(無(wú)狀態(tài))、靈活、穩(wěn)定、高效等特性。

yugong

幫助用戶完成從 Oracle 數(shù)據(jù)遷移到 MySQL。

4. 后記

通過(guò)這篇文章,讓你知道 MySQL 和其它多維數(shù)據(jù)的同步方案,以及常用的數(shù)據(jù)遷移工具,幫助你更好選型。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 定時(shí)器
    +關(guān)注

    關(guān)注

    23

    文章

    3226

    瀏覽量

    114141
  • SQL
    SQL
    +關(guān)注

    關(guān)注

    1

    文章

    751

    瀏覽量

    43984
  • MySQL
    +關(guān)注

    關(guān)注

    1

    文章

    791

    瀏覽量

    26351
  • MYSQL數(shù)據(jù)庫(kù)

    關(guān)注

    0

    文章

    95

    瀏覽量

    9372

原文標(biāo)題:4 種 MySQL 同步 ES 方案,yyds!

文章出處:【微信號(hào):芋道源碼,微信公眾號(hào):芋道源碼】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Linux中常用MySQL運(yùn)維腳本

    在Linux中,使用MySQL進(jìn)行常見(jiàn)的運(yùn)維任務(wù)時(shí),可以編寫(xiě)一些腳本來(lái)簡(jiǎn)化操作。以下是一些常用MySQL運(yùn)維腳本,希望對(duì)你的工作有所幫助。
    發(fā)表于 09-07 09:49 ?713次閱讀

    0基礎(chǔ)學(xué)Mysql:mysql入門(mén)視頻教程!

    的性能調(diào)優(yōu)技術(shù)掌握基于MySQL的架構(gòu)設(shè)計(jì)方案課程目錄:第1節(jié) MySQL課程介紹MySQL的基礎(chǔ)概念(1)第2節(jié)
    發(fā)表于 07-08 10:51

    MySQL及其常用命令介紹

    MySQL 數(shù)據(jù)庫(kù)常用命令
    發(fā)表于 04-12 13:19

    linux配置mysql的兩方式

    方式:a、$ find / -name mysql–print 查看是否有mysql文件夾b、$ netstat -a –n 查看是否打開(kāi)3306端口
    發(fā)表于 07-26 07:46

    Canal是如何同步mysql的增量數(shù)據(jù)的

    Canal是什么?Canal的工作原理是什么?Canal是如何同步mysql的增量數(shù)據(jù)的?
    發(fā)表于 10-27 07:41

    mysql數(shù)據(jù)庫(kù)同步原理

    了數(shù)據(jù)庫(kù)的訪問(wèn)壓力,提升整個(gè)系統(tǒng)的性能和可用性,降低了大訪問(wèn)量引發(fā)數(shù)據(jù)庫(kù)宕機(jī)的故障率。 binlog簡(jiǎn)介 MySQL主從同步是基于binlog文件主從復(fù)制實(shí)現(xiàn),為了更好的理解主從同步過(guò)程,這里簡(jiǎn)單
    發(fā)表于 09-28 11:49 ?0次下載
    <b class='flag-5'>mysql</b>數(shù)據(jù)庫(kù)<b class='flag-5'>同步</b>原理

    Mysql主從同步的實(shí)現(xiàn)原理

    MySQL是一個(gè)關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),由瑞典MySQL AB 公司開(kāi)發(fā),目前屬于 Oracle 旗下產(chǎn)品。MySQL 是最流行的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)之一,在 WEB 應(yīng)用方面,MySQL
    發(fā)表于 12-26 15:56 ?2940次閱讀
    <b class='flag-5'>Mysql</b>主從<b class='flag-5'>同步</b>的實(shí)現(xiàn)原理

    Linux中的常用多線程同步方式淺析

    嵌入式linux中文站給大家介紹Linux中的常用多線程同步方式:互斥量,條件變量,信號(hào)量。
    發(fā)表于 05-02 14:49 ?3015次閱讀
    三<b class='flag-5'>種</b>Linux中的<b class='flag-5'>常用</b>多線程<b class='flag-5'>同步</b>方式淺析

    CCD驅(qū)動(dòng)電路的4常用方式介紹和使用單片機(jī)設(shè)計(jì)CCD驅(qū)動(dòng)電路的說(shuō)明

    介紹了CCD驅(qū)動(dòng)電路的4常用方式及其優(yōu)缺點(diǎn),詳細(xì)闡述了基于高速超微型單片機(jī)C8051F300的CCD驅(qū)動(dòng)電路設(shè)計(jì),包括內(nèi)部CCD驅(qū)動(dòng)時(shí)序和外部輸出
    發(fā)表于 11-26 16:58 ?28次下載
    CCD驅(qū)動(dòng)電路的<b class='flag-5'>4</b><b class='flag-5'>種</b><b class='flag-5'>常用</b>方式<b class='flag-5'>介紹</b>和使用單片機(jī)設(shè)計(jì)CCD驅(qū)動(dòng)電路的說(shuō)明

    MySQL批量插入數(shù)據(jù)的四方案(性能測(cè)試對(duì)比)

    本文記錄個(gè)人使用MySQL插入大數(shù)據(jù)總結(jié)較實(shí)用的方案,通過(guò)對(duì)常用插入大數(shù)據(jù)的4方式進(jìn)行測(cè)試,即for循環(huán)單條、拼接SQL、批量插入save
    的頭像 發(fā)表于 10-28 09:43 ?2615次閱讀

    深度解讀ES+Redis+MySQL的高可用架構(gòu)設(shè)計(jì)

    我們有兩個(gè)機(jī)房,分別是機(jī)房 A 和機(jī)房 B。我們把 ES 主集群部署在機(jī)房 A,把 ES 備集群部署在機(jī)房 B。會(huì)員系統(tǒng)的讀寫(xiě)都在 ES 主集群,通過(guò) MQ 將數(shù)據(jù)同步
    的頭像 發(fā)表于 06-01 10:09 ?664次閱讀
    深度解讀<b class='flag-5'>ES+Redis+MySQL</b>的高可用架構(gòu)設(shè)計(jì)

    MySQL運(yùn)維常用腳本

    進(jìn)入MySQL:?jiǎn)?dòng)MySQL Command Line Client(MySQL的DOS界面),直接輸入安裝時(shí)的密碼即可。此時(shí)的提示符是:mysql>
    的頭像 發(fā)表于 07-29 11:23 ?525次閱讀

    MySQLES4常用數(shù)據(jù)同步方案

    如何實(shí)現(xiàn) MySQL 數(shù)據(jù)庫(kù)和 ES 的數(shù)據(jù)同步,今天和大家聊聊 MySQLES 數(shù)據(jù)同步
    發(fā)表于 08-09 11:36 ?571次閱讀
    <b class='flag-5'>MySQL</b>到<b class='flag-5'>ES</b>的<b class='flag-5'>4</b><b class='flag-5'>種</b><b class='flag-5'>常用</b>數(shù)據(jù)<b class='flag-5'>同步</b><b class='flag-5'>方案</b>

    MySQL常用語(yǔ)句

    MySQL是一個(gè)關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),廣泛應(yīng)用于Web應(yīng)用程序的開(kāi)發(fā)以及數(shù)據(jù)管理領(lǐng)域。在使用MySQL時(shí),有一些常用的語(yǔ)句可以幫助我們進(jìn)行數(shù)據(jù)的操作和管理。接下來(lái),我將詳細(xì)介紹
    的頭像 發(fā)表于 11-21 11:11 ?448次閱讀

    php的mysql無(wú)法啟動(dòng)

    MySQL是一常用的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),而PHP是一廣泛應(yīng)用于服務(wù)器端的腳本語(yǔ)言。在使用PHP開(kāi)發(fā)網(wǎng)站或應(yīng)用時(shí),經(jīng)常會(huì)碰到MySQL無(wú)
    的頭像 發(fā)表于 12-04 15:59 ?1243次閱讀