RAID內存:回寫(xiě)技術(shù)和熱插拔容量技術(shù)
本內容總結了工作中RAID內存的經(jīng)驗教訓。下面分別介紹了在HP的熱插拔技術(shù)中應用到的兩個(gè)小技術(shù),它們就是回寫(xiě)(Scrubbing)技術(shù)和熱插拔容量(Hot-Plug Capabilities)技術(shù)。
HP熱插拔RAID內存提供了一個(gè)回寫(xiě)硬件方式,它可以確認ECC或RAID檢查出來(lái)的軟錯誤。HP技術(shù)嘗試定位于在讀內存時(shí)檢查出來(lái)所有軟錯誤,方法是把改正后的正確的數據寫(xiě)回內存中去。但此方法不適用于硬錯誤。
回寫(xiě)技術(shù)可以阻止軟錯誤的累積,避免發(fā)生更嚴重的錯誤。它降低了ECC的工作量,提高了系統的性能。一些傳統的系統采用的是軟件回寫(xiě),HP熱插拔RAID內存使用硬件完成這個(gè)工作。
HP熱插拔RAID內存會(huì )對錯誤生成錯誤日志,錯誤極限由軟件設定。當記錄的錯誤值達到錯誤極限的時(shí)候,軟件會(huì )自動(dòng)做出反應。例如,當超過(guò)錯誤極限的時(shí)候故障燈會(huì )自動(dòng)亮,這就是由軟件控制的。
熱插拔容量(Hot-Plug Capabilities)技術(shù)
HP熱插拔RAID內存還允許用戶(hù)在不關(guān)閉服務(wù)器電源的情況下在線(xiàn)更換、在線(xiàn)擴展及在線(xiàn)升級DIMM,這就是HP的熱插拔容量技術(shù)。
在線(xiàn)更換是指在系統運行的情況下更換出現故障的DIMM。HP熱插拔RAID內存不需要操作系統的支持,服務(wù)器在購買(mǎi)的時(shí)候就具有支持在線(xiàn)更換的能力。在線(xiàn)擴展指用戶(hù)在空的插槽上插入DIMM以擴展系統容量。在線(xiàn)升級是指用戶(hù)用容量更大的DIMM替代舊的較小容量的DIMM。在線(xiàn)擴展和在線(xiàn)升級都可以使用戶(hù)獲得更大的系統內存容量。在線(xiàn)擴展和在線(xiàn)升級要求操作系統的支持,系統要認出新增的內存。
當在線(xiàn)內存操作完成后,如果工作在熱插拔RAID內存模式下,那么系統會(huì )自動(dòng)在所有的內存盒中重新放置數據(rebuild)。雖然這樣做會(huì )暫時(shí)降低內存的工作性能(重新放置4 GB的數據花費的時(shí)間少于30s),但是只需要花費很少的錢(qián)就可以提高容錯能力,并可避免系統檢修期間帶來(lái)的經(jīng)濟損失。
評論