變更數(shù)據(jù)捕獲 (CDC) 廣義上定義為跟蹤數(shù)據(jù)庫(kù)中的變更。跟蹤更改的目的多種多樣。嵌入式數(shù)據(jù)庫(kù)系統(tǒng)中的 CDC 可以通過(guò)幾種不同的方式實(shí)現(xiàn),這些方式有時(shí)對(duì)應(yīng)用程序是不可見(jiàn)的,也可以通過(guò)這些方式實(shí)現(xiàn)應(yīng)用程序用于數(shù)據(jù)共享、響應(yīng)事件和增量備份。
在嵌入式數(shù)據(jù)庫(kù)中實(shí)現(xiàn)CDC的第一個(gè)(也可能是最明顯的)是實(shí)現(xiàn)事務(wù)的ACID屬性的一部分:原子性,一致性,隔離性和持久性。將事務(wù)成功應(yīng)用于數(shù)據(jù)庫(kù)會(huì)將該數(shù)據(jù)庫(kù)從一個(gè)一致?tīng)顟B(tài)移動(dòng)到一個(gè)新的一致?tīng)顟B(tài)。相反,不成功將事務(wù)應(yīng)用于數(shù)據(jù)庫(kù)必須將數(shù)據(jù)庫(kù)返回到在成功應(yīng)用事務(wù)之前存在的一致?tīng)顟B(tài)。為了滿足這些要求,數(shù)據(jù)庫(kù)管理系統(tǒng)必須跟蹤更改。實(shí)現(xiàn)細(xì)節(jié)因數(shù)據(jù)庫(kù)系統(tǒng)而異,甚至在數(shù)據(jù)庫(kù)系統(tǒng)系列中,從純內(nèi)存中數(shù)據(jù)庫(kù)、持久內(nèi)存中數(shù)據(jù)庫(kù)以及部分或完全持久數(shù)據(jù)庫(kù)(混合數(shù)據(jù)庫(kù))也有所不同。
對(duì)于純內(nèi)存數(shù)據(jù)庫(kù),沒(méi)有記錄更改的事務(wù)日志。因此,在事務(wù)處于活動(dòng)狀態(tài)時(shí),更改或更改記錄的前映像都需要保存在緩沖區(qū)中,以便在事務(wù)中止時(shí)可以將數(shù)據(jù)庫(kù)還原到其事務(wù)前狀態(tài)。
對(duì)于具有持久性的內(nèi)存中數(shù)據(jù)庫(kù),所有更改也會(huì)追加到存儲(chǔ)在持久性媒體上的事務(wù)日志中,該事務(wù)日志可在崩潰后重播以進(jìn)行恢復(fù)。
對(duì)于持久性(基于磁盤的)數(shù)據(jù)庫(kù),還利用事務(wù)日志記錄來(lái)優(yōu)化性能和支持從崩潰中恢復(fù)。在這種情況下,可以提供兩種形式的事務(wù)日志記錄:撤消日志記錄和預(yù)寫日志記錄 (WAL)。WAL 如上一段所述。撤消日志記錄將已更改記錄的前映像寫入事務(wù)日志文件。在發(fā)生崩潰時(shí),UNDO 日志信息用于回滾不完整的事務(wù)(即將數(shù)據(jù)庫(kù)返回到上一個(gè)一致?tīng)顟B(tài))。
CDC在某些數(shù)據(jù)庫(kù)系統(tǒng)中的另一個(gè)內(nèi)部用途是通過(guò)MVCC(多版本并發(fā)控制)實(shí)現(xiàn)樂(lè)觀并發(fā)控制。樂(lè)觀并發(fā)控制意味著應(yīng)用程序不必獲取鎖,這也意味著應(yīng)用程序永遠(yuǎn)不必等待另一個(gè)應(yīng)用程序持有的鎖。這要求數(shù)據(jù)庫(kù)系統(tǒng)知道兩個(gè)應(yīng)用程序是否同時(shí)嘗試修改同一個(gè)數(shù)據(jù)庫(kù)對(duì)象。這是通過(guò)跟蹤提交事務(wù)時(shí)檢查的版本號(hào)來(lái)完成的(因此稱為多版本并發(fā)控制)。如果對(duì)象的版本在應(yīng)用程序獲取對(duì)象副本和應(yīng)用程序想要提交對(duì)該對(duì)象的更改之間發(fā)生了更改,則意味著另一個(gè)應(yīng)用程序首先修改了基礎(chǔ)對(duì)象,必須中止并重試此事務(wù)。MVCC 背后的理論是,這種沖突很少見(jiàn),并且偶爾重試比總是必須獲取鎖并可能使用這些鎖阻止其他應(yīng)用程序更有效。
CDC 還用于需要“五個(gè) 9”可用性(即 99.999% 正常運(yùn)行時(shí)間)的系統(tǒng)的高可用性 (HA) 實(shí)施中。HA 由不同的數(shù)據(jù)庫(kù)供應(yīng)商以不同的方式實(shí)現(xiàn):實(shí)時(shí)事務(wù)復(fù)制、SQL 語(yǔ)句復(fù)制、日志文件轉(zhuǎn)發(fā)等。有所謂的 1-safe(又名惰性、異步)和 2-safe(又名 eager、同步)實(shí)現(xiàn)。例如,實(shí)時(shí)事務(wù)復(fù)制可以是 1 安全或 2 安全(在eXtremeDB 中,我們將其稱為時(shí)間識(shí)別兩階段提交);日志轉(zhuǎn)發(fā)本質(zhì)上是 1 安全的。
CDC 可在嵌入式數(shù)據(jù)庫(kù)和/或第三方系統(tǒng)中用于可在應(yīng)用程序中使用的其他目的:開(kāi)放復(fù)制、觸發(fā)器/事件通知和增量備份。
一些嵌入式數(shù)據(jù)庫(kù)系統(tǒng)實(shí)現(xiàn)復(fù)制,例如,支持高可用性和/或數(shù)據(jù)庫(kù)集群。此類系統(tǒng)使得在同一數(shù)據(jù)庫(kù)系統(tǒng)的兩個(gè)或多個(gè)實(shí)例之間復(fù)制數(shù)據(jù)或事務(wù)變得容易,但是當(dāng)需要從嵌入式數(shù)據(jù)庫(kù)復(fù)制到任何其他目標(biāo)時(shí),它們不是解決方案。有第三方產(chǎn)品試圖填補(bǔ)這一空白,例如Actian DataConnect和Oracle Golden Gate。或者通過(guò)自定義提取-轉(zhuǎn)換-加載 (ETL) 解決方案,該解決方案可能對(duì)源和/或目標(biāo)數(shù)據(jù)庫(kù)中的更改敏感。
觸發(fā)器和事件通知方案是變更數(shù)據(jù)捕獲的典型用例。畢竟,觸發(fā)器是在指定表的 INSERT、UPDATE 或 DELETE 語(yǔ)句執(zhí)行時(shí)觸發(fā)的。換句話說(shuō),數(shù)據(jù)已經(jīng)改變,觸發(fā)器捕獲了該變化,以便周圍系統(tǒng)以某種方式采取行動(dòng)。
嵌入式數(shù)據(jù)庫(kù)系統(tǒng)中變更數(shù)據(jù)捕獲的最后一個(gè)重要目的是實(shí)現(xiàn)增量備份設(shè)施。增量備份方案必須知道在上次完整快照或上次增量備份之間數(shù)據(jù)庫(kù)中發(fā)生的增量更改。
結(jié)論
變更數(shù)據(jù)捕獲是任何數(shù)據(jù)庫(kù)管理系統(tǒng)的核心。它有助于實(shí)現(xiàn)并發(fā)性和持久性、復(fù)制、觸發(fā)器/事件通知以及備份和還原的 ACID 屬性。
審核編輯:郭婷
-
嵌入式
+關(guān)注
關(guān)注
5054文章
18917瀏覽量
300961 -
數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
7文章
3739瀏覽量
64181 -
觸發(fā)器
+關(guān)注
關(guān)注
14文章
1992瀏覽量
60981
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論