遇到RAID5陣列硬盤(pán)故障該如何解決_第1頁(yè)
遇到RAID5陣列硬盤(pán)故障該如何解決_第2頁(yè)
遇到RAID5陣列硬盤(pán)故障該如何解決_第3頁(yè)
遇到RAID5陣列硬盤(pán)故障該如何解決_第4頁(yè)
遇到RAID5陣列硬盤(pán)故障該如何解決_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

遇到RAID5陣列硬盤(pán)故障該如何解決?【故障描述】華為S5300,12塊FC硬盤(pán),整個(gè)存儲(chǔ)空間由450GB和600GFC的硬盤(pán)組成,其中11塊硬盤(pán)組成一個(gè)RAID5的陣列,剩余1塊做成熱備盤(pán)使用。由于RAID5陣列中出現(xiàn)1塊硬盤(pán)故障,熱備盤(pán)成功激活,在進(jìn)行同步的過(guò)程中又一塊硬盤(pán)出現(xiàn)故障,因此導(dǎo)致RAID5陣列癱瘓,上層LUN無(wú)法正常使用?!净謴?fù)過(guò)程】一、檢測(cè)磁盤(pán)由于存儲(chǔ)是因?yàn)镽AID陣列中某些磁盤(pán)掉線,從而導(dǎo)致整個(gè)存儲(chǔ)不可用。因此接收到磁盤(pán)以后先對(duì)所有磁盤(pán)做物理檢測(cè),檢測(cè)完后發(fā)現(xiàn)一塊硬盤(pán)有物理故障,其他硬盤(pán)沒(méi)有物理故障。二、備份數(shù)據(jù)考慮到,數(shù)據(jù)的安全性以及可還原性,在做數(shù)據(jù)恢復(fù)之前需要對(duì)所有源數(shù)據(jù)做備份,以防萬(wàn)一其他原因?qū)е聰?shù)據(jù)無(wú)法再次恢復(fù)。使用dd命令或winhex工具將所有磁盤(pán)都鏡像成文件。三、故障分析1、分析故障原因由于前兩個(gè)步驟并檢測(cè)到磁盤(pán)有物理故障,由此推斷可能是由于某些磁盤(pán)讀寫(xiě)不穩(wěn)定和物理故障導(dǎo)致故障發(fā)生。因?yàn)槿A為S5300控制器檢查磁盤(pán)的策略很?chē)?yán)格,一旦某些磁盤(pán)性能不穩(wěn)定,華為S5300控制器就認(rèn)為是壞盤(pán),就將認(rèn)為是壞盤(pán)的磁盤(pán)踢出RAID組。而一旦RAID組中掉線的盤(pán)到達(dá)到RAID級(jí)別允許掉盤(pán)的極限,那么這個(gè)RAID組將變的不可用,上層基于RAID組的LUN也將變的不可用,之后又新建RAID,有一塊硬盤(pán)在同步的過(guò)程中被損壞,目前初步了解的情況為基于RAID組的LUN分配給linux系統(tǒng)使用,重要數(shù)據(jù)為Oracle數(shù)據(jù)庫(kù)。2、分析RAID組結(jié)構(gòu)華為S5300存儲(chǔ)的LUN都是基于RAID組的,因此需要先分析底層RAID組的信息,然后根據(jù)分析的信息重構(gòu)原始的RAID組。分析每一塊數(shù)據(jù)盤(pán),發(fā)現(xiàn)一塊盤(pán)的數(shù)據(jù)同其它數(shù)據(jù)盤(pán)不太一樣,初步認(rèn)為可能是hotSpare盤(pán)。接著分析其他數(shù)據(jù)盤(pán),分析Oracle數(shù)據(jù)庫(kù)頁(yè)在每個(gè)磁盤(pán)中分布的情況,并根據(jù)數(shù)據(jù)分布的情況得出RAID組的條帶大小,磁盤(pán)順序及數(shù)據(jù)走向等RAID組的重要信息。3、分析RAID組被同步損壞盤(pán)根據(jù)上述分析的RAID信息,嘗試通過(guò)北亞自主開(kāi)發(fā)的RAID虛擬程序?qū)⒃嫉腞AID組虛擬出來(lái)。但由于整個(gè)RAID組中掉線兩塊盤(pán)并且有一塊硬盤(pán)數(shù)據(jù)被同步損壞。仔細(xì)分析每一塊硬盤(pán)中的數(shù)據(jù),發(fā)現(xiàn)有一塊硬盤(pán)在同一個(gè)條帶上的數(shù)據(jù)和其他硬盤(pán)明顯不一樣,因此初步判斷此硬盤(pán)可能是被同步掉損壞的硬盤(pán),通過(guò)北亞自主開(kāi)發(fā)的RAID校驗(yàn)程序?qū)@個(gè)條帶做校驗(yàn),因此可以明確被同步損壞盤(pán)了。4、分析RAID組中的LUN信息由于LUN是基于RAID組的,因此需要根據(jù)上述分析的信息將RAID組最新的狀態(tài)虛擬出來(lái)。然后分析LUN在RAID組中的分配情況,以及LUN分配的數(shù)據(jù)塊MAP。因此只需要將LUN的數(shù)據(jù)塊分布MAP提取出來(lái)。然后針對(duì)這些信息編寫(xiě)相應(yīng)的程序,LUN的數(shù)據(jù)MAP做解析,然后根據(jù)數(shù)據(jù)MAP并導(dǎo)出LUN的數(shù)據(jù)。四、解析EXT3文件系統(tǒng)1、解析EXT3文件系統(tǒng) 由于是使用熱備盤(pán)虛擬的RAID結(jié)構(gòu),EXT3文件系統(tǒng)無(wú)法正常掛載,所以只能提取oracle數(shù)據(jù)庫(kù)文件,利用自主開(kāi)發(fā)的文件系統(tǒng)解析程序?qū)ζ溥M(jìn)行文件系統(tǒng)的解析,導(dǎo)出oracle數(shù)據(jù)庫(kù)文件,并把數(shù)據(jù)庫(kù)文件移交給數(shù)據(jù)庫(kù)工程師進(jìn)行校驗(yàn)和驗(yàn)證五、檢測(cè)Oracle數(shù)據(jù)庫(kù)文件及修復(fù)1、檢測(cè)數(shù)據(jù)庫(kù)文件是否完整 使用Oracle數(shù)據(jù)庫(kù)文件檢測(cè)工具檢測(cè)每個(gè)數(shù)據(jù)庫(kù)文件是否完整,發(fā)現(xiàn)有錯(cuò)誤。再使用北亞自主研發(fā)的Oracle數(shù)據(jù)庫(kù)檢測(cè)工具(檢驗(yàn)更嚴(yán)格),發(fā)現(xiàn)有部分?jǐn)?shù)據(jù)庫(kù)文件和日志文件錯(cuò)誤,system和sysaux表空間各存在100多壞塊;3個(gè)控制文件都存在壞塊許多壞塊,控制文件全部損壞;eschoolspace表空間的3個(gè)文件的壞塊更多,達(dá)到1000個(gè);undotbs02丟失;數(shù)據(jù)庫(kù)工程師對(duì)此類(lèi)文件進(jìn)行修復(fù),如下圖:2、修復(fù)Oracle數(shù)據(jù)庫(kù) 我們創(chuàng)建了控制文件,創(chuàng)建undo表空間,啟動(dòng)數(shù)據(jù)庫(kù)到mount。system數(shù)據(jù)文件壞塊使得數(shù)據(jù)庫(kù)不能open。各種隱含參數(shù)也不能繞過(guò)system的壞塊;搭建數(shù)據(jù)庫(kù)環(huán)境。使用dmp文件還原數(shù)據(jù)庫(kù)。使用3月9號(hào)之后的導(dǎo)入,都報(bào)錯(cuò),大約只能導(dǎo)入10G左右的數(shù)據(jù),如下圖:六、數(shù)據(jù)驗(yàn)證 由用戶(hù)方配合,啟動(dòng)Oracle數(shù)據(jù)庫(kù),在本地虛擬機(jī)安裝OA客戶(hù)端。通過(guò)OA客戶(hù)端對(duì)數(shù)據(jù)記錄進(jìn)行驗(yàn)證,并且用戶(hù)安排不同部門(mén)人員進(jìn)行遠(yuǎn)程驗(yàn)證。七、數(shù)據(jù)恢復(fù)結(jié)論由于故障發(fā)生

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論