<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 模擬技術(shù) > 設計應用 > 重復數據刪除技術(shù)分析及分類(lèi)

重復數據刪除技術(shù)分析及分類(lèi)

作者：時(shí)間：2012-04-03 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

重復數據刪除也稱(chēng)為智能壓縮或單一實(shí)例存儲，是一種可自動(dòng)搜索重復數據，將相同數據只保留唯一的一個(gè)副本，并使用指向單一副本的指針替換掉其他重復副本，以達到消除冗余數據、降低存儲容量需求的存儲技術(shù)。

本文首先從不同角度介紹重復數據刪除技術(shù)的分類(lèi)，然后分別介紹相同數據重復數據刪除技術(shù)和相似數據重復數據刪除技術(shù)，并介紹重復數據消除的性能提升方法，最后分析重復數據技術(shù)的應用場(chǎng)景。

1 重復數據刪除技術(shù)的分類(lèi)

1.1 基于重復內容識別方法的分類(lèi)

(1)基于散列識別

該方法通過(guò)數據的散列值來(lái)判斷是否是重復數據。對于每個(gè)新數據塊都生成一個(gè)散列，如果數據塊的散列與存儲設備上散列索引中的一個(gè)散列匹配，就表明該數據塊是一個(gè)重復的數據塊。Data Domain、飛康、昆騰的DXi系列設備都是采用SHA-1、MD-5等類(lèi)似的散列算法來(lái)進(jìn)行重復數據刪除。

基于散列的方法存在內置的可擴展性問(wèn)題。為了快速識別一個(gè)數據塊是否已經(jīng)被存儲，這種基于散列的方法會(huì )在內存中擁有散列索引。隨著(zhù)數據塊數量增加，該索引也隨之增長(cháng)。一旦索引增長(cháng)超過(guò)了設備在內存中保存它所支持的容量，性能會(huì )急速下降，同時(shí)磁盤(pán)搜索會(huì )比內存搜索更慢。因此，目前大部分基于散列的系統都是獨立的，可以保持存儲數據所需的內存量與磁盤(pán)空間量的平衡。這樣的設計使得散列表就永遠不會(huì )變得太大。

(2)基于內容識別

該方法采用內嵌在數據中的文件系統的元數據識別文件，與其數據存儲庫中的其他版本進(jìn)行逐字節地比較，找到該版本與第一個(gè)已存儲版本的不同之處并為這些不同的數據創(chuàng )建一個(gè)增量文件。這種方法可以避免散列沖突，但是需要使用支持該功能的應用設備以便設備可以提取元數據。

(3)基于ProtecTier VTL的技術(shù)

這種方法像基于散列的方法產(chǎn)品那樣將數據分成塊，并且采用自有算法決定給定的數據塊是否與其他數據塊的相似，然后與相似塊中的數據進(jìn)行逐字節的比較，以判斷該數據塊是否已經(jīng)被存儲。

1.2 基于去重粒度的分類(lèi)

(1)全文件層次的重復數據刪除

以整個(gè)文件為單位來(lái)檢測和刪除重復數據，計算整個(gè)文件的哈希值，然后根據文件哈希值查找存儲系統中是否存在相同的文件。這種方法的好處是在普通硬件條件下計算速度非?？?；這種方法的缺點(diǎn)是即使不同文件存在很多相同的數據，也無(wú)法刪除文件中的重復數據。

(2)文件塊消冗

將一個(gè)文件按不同的方式劃分成數據塊，以數據塊為單位進(jìn)行檢測。該方法的優(yōu)點(diǎn)是計算速度快、對數據變化較敏感。

(3)字節級消冗

上一頁(yè) 1 2 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 重復數據 刪除技術(shù)

評論

相關(guān)推薦

重復數據刪除技術(shù)分析及分類(lèi)

模擬技術(shù) 重復數據刪除技術(shù) | 2012-04-03

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>