服務器存儲數(shù)據(jù)恢復環(huán)境:
EMC某型號存儲,8塊組建一組raid5磁盤陣列。上層操作系統(tǒng)采用zfs文件系統(tǒng)。
服務器存儲故障&分析:
raid5陣列中有2塊硬盤未知原因離線,raid5陣列崩潰,上層應用無法正常使用。
服務器數(shù)據(jù)恢復過程:
1、將故障服務器存儲內的所有硬盤編號后取出,由硬件工程師檢測所有磁盤是否存在硬件故障,經(jīng)過檢測沒有發(fā)現(xiàn)有硬盤(包括兩塊掉線硬盤)存在物理故障。將所有磁盤以只讀方式進行扇區(qū)級別的全盤鏡像,鏡像完成后將所有磁盤按照編號還原到原存儲中。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析底層數(shù)據(jù),通過計算獲取服務器raid5陣列的硬盤盤序、raid條帶大小和其他raid陣列相關信息,利用獲取到的raid相關信息重組raid5陣列。
3、由于該型號EMC存儲中LUN是基于RAID的。raid5陣列重組出來后,北亞企安數(shù)據(jù)恢復工程師分析LUN在RAID陣列中的分配信息&LUN分配的數(shù)據(jù)塊MAP。因為底層只有一個LUN,所以只需要分析一份LUN的信息即可。
4、根據(jù)分析出的LUN信息,使用北亞企安自主研發(fā)的程序解釋LUN的數(shù)據(jù)MAP&導出LUN的所有數(shù)據(jù)。
5、對導出的lun進行文件系統(tǒng)解釋,但是在文件系統(tǒng)解釋過程中報錯。分析報錯內容并對文件系統(tǒng)解釋程序進行調試,經(jīng)過分析確認導致zfs文件系統(tǒng)解釋過程中報錯的原因是該存儲中某些元文件損壞。北亞企安數(shù)據(jù)恢復工程師手動修復這些損壞的文件,直到可以完全正常解析zfs文件系統(tǒng)。
6、完成zfs文件系統(tǒng)的修復和解析后,驗證恢復出來的數(shù)據(jù)沒有發(fā)現(xiàn)問題。讓用戶方工程師對恢復出來的數(shù)據(jù)進行驗證,經(jīng)過反復驗證,用戶方工程師確認恢復數(shù)據(jù)完整有效。本次數(shù)據(jù)恢復工作完成。
審核編輯 黃宇
-
存儲
+關注
關注
13文章
4170瀏覽量
85481 -
服務器
+關注
關注
12文章
8843瀏覽量
84946 -
數(shù)據(jù)恢復
+關注
關注
10文章
525瀏覽量
17311 -
emc
+關注
關注
167文章
3816瀏覽量
182531 -
RAID5
+關注
關注
0文章
106瀏覽量
12693
發(fā)布評論請先 登錄
相關推薦
評論