重復數據刪除技術(shù)分析及分類(lèi)
1.3 基于消冗執行次序的分類(lèi)
(1)在線(xiàn)式消冗
在線(xiàn)處理的重復數據刪除是指在數據寫(xiě)入磁盤(pán)之前執行重復數據刪除。其最大的優(yōu)點(diǎn)是經(jīng)濟高效,可以降低對存儲容量的需求,并且不需要用于保存還未進(jìn)行重復數據刪除的數據集。在線(xiàn)處理的重復數據刪除減少了數據量,但同時(shí)也存在一個(gè)問(wèn)題,處理本身會(huì )減慢數據吞吐速度。正是因為重復數據刪除是在寫(xiě)入到磁盤(pán)之前進(jìn)行的,因此重復數據刪除處理本身就是一個(gè)單點(diǎn)故障。
(2)后處理式消冗
后處理的重復數據刪除,也被稱(chēng)為離線(xiàn)重復數據刪除,是在數據寫(xiě)到磁盤(pán)后再執行重復數據刪除。數據先被寫(xiě)入到臨時(shí)的磁盤(pán)空間,之后再開(kāi)始重復數據刪除,最后將經(jīng)過(guò)重復數據刪除的數據拷貝到末端磁盤(pán)。由于重復數據刪除是數據寫(xiě)入磁盤(pán)后再在單獨的存儲設備上執行的,因此不會(huì )對正常業(yè)務(wù)處理造成影響。管理員可以隨意制訂重復數據刪除的進(jìn)程。通常先將備份數據保留在磁盤(pán)上再進(jìn)行重復數據刪除,企業(yè)在需要時(shí)可以更快速地訪(fǎng)問(wèn)最近存儲的文件和數據。而后處理方式的最大問(wèn)題在于它需要額外的磁盤(pán)空間來(lái)保存全部還未刪除的重復數據集。
1.4 基于實(shí)現層次的分類(lèi)
(1)基于軟件的重復數據刪除
在軟件層次,重復數據刪除可以有兩種集成方式,即可以將軟件產(chǎn)品安裝在專(zhuān)用的服務(wù)器上實(shí)現,也可以將其集成到備份/歸檔軟件中?;谲浖闹貜蛿祿h除的部署成本比較低;但是基于軟件的重復數據刪除在安裝中容易中斷運行,維護也更加困難。
基于軟件的重復數據刪除產(chǎn)品有EMC公司的Avamar軟件產(chǎn)品、Symantec公司的Veritas NetBackup產(chǎn)品以及Sepaton公司的DeltaStor存儲軟件等。
(2)基于硬件的重復數據刪除
基于硬件的重復數據刪除主要由存儲系統自己完成數據的刪減,例如:在虛擬磁帶庫系統、備份平臺或者網(wǎng)絡(luò )附加存儲(NAS)等一般目的的存儲系統中融入重復數據刪除機制,由這些系統自身完成重復數據刪除功能。
基于硬件的重復數據刪除的優(yōu)點(diǎn)是高性能、可擴展性和相對無(wú)中斷部署,并且重復數據刪除操作對上層的應用都是透明的。這種設備的缺點(diǎn)就是部署成本比較高,要高于基于軟件的重復數據刪除。
目前基于硬件的重復數據刪除系統主要包括VTL和NAS備份產(chǎn)品兩大類(lèi),例如:Data Domain公司的DD410系列產(chǎn)品、Diligent Technologies公司的ProtecTier VTL、昆騰公司的DXi3500和DXi5500系列產(chǎn)品、飛康的VTL產(chǎn)品、ExaGrid Systems公司的NAS備份產(chǎn)品以及NetApp的NearStore R200和FAS存儲系統。
評論