0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

raid5故障導(dǎo)致SAP應(yīng)用崩潰的數(shù)據(jù)恢復(fù)案例

Frombyte ? 來源:Frombyte ? 作者:Frombyte ? 2023-04-07 14:53 ? 次閱讀

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:

IBM某型號服務(wù)器中6塊硬盤搭建的raid5磁盤陣列,其中1塊盤作為熱備盤使用。

上層部署的是SAP應(yīng)用+Oracle數(shù)據(jù)庫。

服務(wù)器故障&檢測

服務(wù)器中RAID5磁盤陣列中的1塊盤出現(xiàn)故障離線,熱備盤激活替換離線硬盤,在進行數(shù)據(jù)同步的過程中又有一塊硬盤故障離線,RAID5磁盤陣列癱瘓,上層LUN不可用,服務(wù)器崩潰。

IBM服務(wù)器中的LUN是基于RAID組的。分析故障raid5中的所有硬盤,發(fā)現(xiàn)其中一塊盤的數(shù)據(jù)同其它盤有明顯不同,初步判斷這塊盤就是HotSpare盤。分析其他盤以及Oracle數(shù)據(jù)庫頁在每個磁盤中的分布情況,獲取到該RAID5的條帶大小、磁盤順序及數(shù)據(jù)走向等RAID相關(guān)信息。利用獲取到的raid相關(guān)信息虛擬重構(gòu)RAID5,然后分析LUN在RAID5中的分配情況以及LUN分配的數(shù)據(jù)塊MAP。只需要將LUN的數(shù)據(jù)塊分布MAP提取出來,針對這些信息編寫相應(yīng)的程序,解析LUN的數(shù)據(jù)MAP,然后根據(jù)數(shù)據(jù)MAP導(dǎo)出LUN的數(shù)據(jù)即可恢復(fù)數(shù)據(jù)。

服務(wù)器數(shù)據(jù)恢復(fù)過程:

一、恢復(fù)Oracle數(shù)據(jù)庫數(shù)據(jù)。

1、將包含Oracle數(shù)據(jù)庫數(shù)據(jù)的LUN進行JFS2文件系統(tǒng)解析,人工修復(fù)文件系統(tǒng)的不完整部分。

2、利用北亞企安自主開發(fā)的JFS2文件系統(tǒng)解析工具解析修復(fù)完成的LUN,然后恢復(fù)文件系統(tǒng)中所有的Oracle數(shù)據(jù)庫文件。

3、檢測Oracle數(shù)據(jù)庫文件的完整性。針對檢測有壞塊的數(shù)據(jù)庫文件,通過掃描所有硬盤找到所有Oracle碎片,組合掃描到的數(shù)據(jù)頁,人工將有壞塊的數(shù)據(jù)庫文件修復(fù)完整。

4、恢復(fù)完所有Oracle數(shù)據(jù)庫之后,發(fā)現(xiàn)SAP應(yīng)用還是無法正常使用。經(jīng)過分析發(fā)現(xiàn)SAP應(yīng)用的一些重要數(shù)據(jù)也是存放在損壞的存儲中,如果沒有這些重要的數(shù)據(jù),即使在Oracle數(shù)據(jù)庫完整的情況下SAP應(yīng)用也無法正常使用。

二、恢復(fù)SAP應(yīng)用數(shù)據(jù)。

1、對恢復(fù)出來的所有LUN都進行文件系統(tǒng)解析,將包含SAP應(yīng)用數(shù)據(jù)的LUN進行文件系統(tǒng)的一致性檢測。人工修復(fù)文件系統(tǒng)不完整部分,直至恢復(fù)出所有SAP及SAP Test的數(shù)據(jù)。

2、檢測恢復(fù)出來的SAP應(yīng)用數(shù)據(jù),對損壞的SAP應(yīng)用數(shù)據(jù)進行修復(fù),直至所有SAP數(shù)據(jù)都完整,只有這樣才能保證SAP應(yīng)用能夠正常使用。

3、SAP數(shù)據(jù)修復(fù)完成后,結(jié)合之前恢復(fù)出來的Oracle數(shù)據(jù)庫,即可啟動SAP應(yīng)用了。

三、啟動并修復(fù)Oracle數(shù)據(jù)庫及SAP應(yīng)用

1、啟動數(shù)據(jù)庫并修復(fù)。

把恢復(fù)的Oracle數(shù)據(jù)庫文件還原到已搭建好的環(huán)境中,并嘗試啟動Oracle數(shù)據(jù)庫。在啟動過程中由于數(shù)據(jù)庫一些臨時文件的校驗不一致導(dǎo)致數(shù)據(jù)庫啟動失敗。聯(lián)系Oracle數(shù)據(jù)庫工程師對數(shù)據(jù)庫進行修復(fù),修復(fù)完成后Oracle數(shù)據(jù)庫啟動成功,經(jīng)過反復(fù)驗證確認數(shù)據(jù)庫中的所有用戶及所有表均完整,然后嘗試啟動SAP。

2、啟動SAP并修復(fù)。

將恢復(fù)出來的SAP數(shù)據(jù)還原到已搭建好的環(huán)境中并啟動SAP,SAP啟動正常,但SAP中的用戶權(quán)限及使用異常,SAP表現(xiàn)為沒有序列號。北亞企安數(shù)據(jù)恢復(fù)工程師初步判斷是因為SAP的注冊文件沒有恢復(fù)出來。重新檢測恢復(fù)過程,排查可能疏忽的地方,結(jié)果發(fā)現(xiàn)確實因為文件系統(tǒng)損壞導(dǎo)致某些文件沒有恢復(fù)出來。重新修復(fù)文件系統(tǒng)并恢復(fù)這些數(shù)據(jù),然后啟動并檢查SAP,結(jié)果一切正常。

3、在用戶方工程師配合下啟動服務(wù)器內(nèi)的Oracle數(shù)據(jù)庫和SAP,通過SAP客戶端反復(fù)驗證SAP中所有的數(shù)據(jù),沒有發(fā)現(xiàn)任何問題,恢復(fù)出來的數(shù)據(jù)完整可用。本次數(shù)據(jù)恢復(fù)任務(wù)完成。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8874

    瀏覽量

    84984
  • 數(shù)據(jù)恢復(fù)

    關(guān)注

    10

    文章

    528

    瀏覽量

    17319
  • 磁盤
    +關(guān)注

    關(guān)注

    1

    文章

    357

    瀏覽量

    25145
  • RAID5
    +關(guān)注

    關(guān)注

    0

    文章

    106

    瀏覽量

    12694
收藏 人收藏

    評論

    相關(guān)推薦

    RAID5數(shù)據(jù)恢復(fù)—如何重組RAID5陣列?

    RAID5數(shù)據(jù)恢復(fù)環(huán)境: 一臺存儲上有一組由12塊SCSI硬盤(11塊數(shù)據(jù)盤+1塊熱備盤)組建的RAID5磁盤陣列,F(xiàn)reeBSD操作系統(tǒng)
    的頭像 發(fā)表于 10-22 15:48 ?85次閱讀
    <b class='flag-5'>RAID5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—如何重組<b class='flag-5'>RAID5</b>陣列?

    服務(wù)器數(shù)據(jù)恢復(fù)—雙循環(huán)RAID5陣列崩潰,數(shù)據(jù)如何恢復(fù)

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 一臺存儲中有一組由7塊硬盤組建的RAID5陣列,存儲中還有另外3塊盤是raid中掉線的硬盤(硬盤掉線了,管理員只是添加一塊的新的硬盤做rebuild,并沒有
    的頭像 發(fā)表于 09-02 11:35 ?257次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤未完全激活導(dǎo)致陣列崩潰數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 北京某企業(yè)一臺EMC FCAX-4存儲上搭建一組由12塊成員盤的raid5磁盤陣列,其中包括2塊熱備盤。 服務(wù)器存儲故障
    的頭像 發(fā)表于 07-12 10:58 ?255次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列硬盤壞道導(dǎo)致raid崩潰數(shù)據(jù)恢復(fù)案例

    raid5陣列有23塊成員盤)。存儲系統(tǒng)上層一共分了11個卷。 服務(wù)器存儲故障: 磁盤故障導(dǎo)致27盤RAID5陣列
    的頭像 發(fā)表于 07-05 12:00 ?410次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—磁盤離線但熱備盤未完全啟用導(dǎo)致raid5陣列崩潰數(shù)據(jù)恢復(fù)案例

    一臺EMC某型號存儲由于存儲中raid5陣列出現(xiàn)故障導(dǎo)致服務(wù)器崩潰,由于數(shù)據(jù)涉密,需要工程師到現(xiàn)場恢復(fù)數(shù)
    的頭像 發(fā)表于 06-11 13:51 ?221次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—磁盤離線但熱備盤未完全啟用<b class='flag-5'>導(dǎo)致</b><b class='flag-5'>raid5</b>陣列<b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—同友存儲raid5陣列崩潰數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 某市教育局同友存儲,存儲中有一組由數(shù)塊磁盤組建的raid5陣列,存儲空間劃分若干lun。每個lun中有若干臺虛擬機,其中有數(shù)臺linux操作系統(tǒng)的虛擬機為重要數(shù)據(jù)
    的頭像 發(fā)表于 06-11 11:45 ?405次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—同友存儲<b class='flag-5'>raid5</b>陣列<b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—X3650服務(wù)器raid5磁盤陣列數(shù)據(jù)恢復(fù)案例

    一臺某品牌X3650M3服務(wù)器,服務(wù)器中有一組raid5磁盤陣列,上層采用zfs文件系統(tǒng)。 服務(wù)器未知原因崩潰,工作人員排查故障后發(fā)現(xiàn)服務(wù)器的raid5陣列中有兩塊硬盤離線
    的頭像 發(fā)表于 06-04 11:08 ?446次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5多塊磁盤掉線導(dǎo)致崩潰數(shù)據(jù)恢復(fù)案例

    某公司的一臺服務(wù)器中的raid5磁盤陣列有兩塊磁盤先后掉線,服務(wù)器崩潰故障服務(wù)器的操作系統(tǒng)為linux,操作系統(tǒng)部署了oa,數(shù)據(jù)庫為oracle。oracle
    的頭像 發(fā)表于 05-21 11:43 ?633次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b>多塊磁盤掉線<b class='flag-5'>導(dǎo)致</b><b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—StorNext文件系統(tǒng)下raid5數(shù)據(jù)恢復(fù)案例

    ,劃分2個存儲系統(tǒng)。 服務(wù)器故障數(shù)據(jù)存儲的1個存儲系統(tǒng)中的一組RAID5陣列中有2塊硬盤先后出現(xiàn)故障離線,導(dǎo)致
    的頭像 發(fā)表于 04-22 14:51 ?345次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—StorNext文件系統(tǒng)下<b class='flag-5'>raid5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5上層SAP+oracle數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 某品牌服務(wù)器存儲中有一組由6塊SAS硬盤組建的RAID5陣列,其中有1塊硬盤作為熱備盤使用。上層劃分若干lun,存放Oracle數(shù)據(jù)
    的頭像 發(fā)表于 04-15 16:52 ?346次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲raid5數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 華為OceanStor某型號存儲,存儲內(nèi)有一組由24塊硬盤組建的raid5陣列,配置1塊熱備盤。 服務(wù)器故障: 該存儲
    的頭像 發(fā)表于 01-18 11:58 ?408次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—華為OceanStor存儲<b class='flag-5'>raid5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    【服務(wù)器數(shù)據(jù)恢復(fù)raid5崩潰導(dǎo)致同友存儲無法啟動的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺同友存儲,存儲上有一組raid5磁盤陣列,存儲上層有若干臺虛擬機,其中有3臺linux操作系統(tǒng)虛擬機上存放重要數(shù)據(jù)。 服務(wù)器
    的頭像 發(fā)表于 01-02 13:28 ?307次閱讀
    【服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>】<b class='flag-5'>raid5</b><b class='flag-5'>崩潰</b><b class='flag-5'>導(dǎo)致</b>同友存儲無法啟動的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)-raid5故障導(dǎo)致上層卷無法掛載的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺服務(wù)器中有一組由24塊FC硬盤組建的raid5磁盤陣列,linux操作系統(tǒng)+ext3文件系統(tǒng),服務(wù)器上層部署有oracle數(shù)據(jù)庫。 服務(wù)器
    的頭像 發(fā)表于 12-14 11:32 ?458次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5熱備盤未激活導(dǎo)致陣列崩潰數(shù)據(jù)恢復(fù)案例

    (oracle已經(jīng)不再為該OA系統(tǒng)提供后續(xù)服務(wù)支持)。 服務(wù)器故障raid5中一塊磁盤離線,熱備盤未自動激活rebuild(原因不明)。服務(wù)器在運行一段時間后,另一塊磁盤離線,RAID5陣列
    的頭像 發(fā)表于 12-12 13:58 ?456次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b>熱備盤未激活<b class='flag-5'>導(dǎo)致</b>陣列<b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲raid5故障數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: EMC某型號存儲,8塊組建一組raid5磁盤陣列。上層操作系統(tǒng)采用zfs文件系統(tǒng)。 服務(wù)器存儲故障&分析: ra
    的頭像 發(fā)表于 11-30 11:59 ?514次閱讀