服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境&故障:
由于機(jī)房多次斷電導(dǎo)致一臺服務(wù)器中raid陣列信息丟失。該陣列中存放的是文檔,上層安裝的是Windows server操作系統(tǒng),沒有配置ups。
因?yàn)榉?wù)器異常斷電重啟后,raid陣列可以正常使用,所以未引起管理員的注意。后續(xù)出現(xiàn)的多次異常斷電導(dǎo)致raid報(bào)錯,服務(wù)器無法找到存儲設(shè)備,進(jìn)入raid管理模塊進(jìn)行任何操作都會導(dǎo)致操作系統(tǒng)死機(jī)。管理員嘗試多次重啟服務(wù)器,故障依舊。
服務(wù)器故障分析:
北亞企安數(shù)據(jù)恢復(fù)工程師在日常工作中經(jīng)常碰到這類故障。出現(xiàn)這類故障的原因:1、管理員沒有及時(shí)檢修服務(wù)器設(shè)備狀態(tài),服務(wù)器在即將出現(xiàn)故障的時(shí)候沒有及時(shí)處理。2、raid陣列一旦創(chuàng)建完成后,理論上raid信息不會改變,但是意外斷電也可以導(dǎo)致raid信息丟失。
本案例中的故障情況極有可能就是服務(wù)器多次斷電導(dǎo)致raid卡硬件損壞。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障服務(wù)器陣列中所有磁盤編號后取出,由硬件工程師檢測后沒有發(fā)現(xiàn)有硬盤存在硬件故障。以只讀方式將所有磁盤做扇區(qū)級別的全盤鏡像,在鏡像過程中觀察這些硬盤的物理狀態(tài),確認(rèn)無物理故障。鏡像完成后將所有磁盤按照編號還原到原服務(wù)器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析所有硬盤底層數(shù)據(jù),結(jié)合文件系統(tǒng)存儲規(guī)則分析獲取到該raid陣列中的raid數(shù)據(jù)塊大小、raid盤序以及raid校驗(yàn)方式。使用分析得到這些raid信息虛擬重組raid陣列。
3、重組完raid磁盤陣列后進(jìn)行邏輯校驗(yàn),校驗(yàn)無誤后再交由用戶方進(jìn)行驗(yàn)證。
4、用戶仔細(xì)驗(yàn)證后,確認(rèn)服務(wù)器raid陣列中的數(shù)據(jù)已經(jīng)恢復(fù)到故障前的狀態(tài),本次服務(wù)器數(shù)據(jù)恢復(fù)工作完成。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
8843瀏覽量
84946 -
RAID
+關(guān)注
關(guān)注
0文章
266瀏覽量
35008 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
525瀏覽量
17311 -
磁盤
+關(guān)注
關(guān)注
1文章
355瀏覽量
25138
發(fā)布評論請先 登錄
相關(guān)推薦
評論