海量存儲機群系統中提高系統MTTF的設計和分析
下面,以m=3為例,求系統進(jìn)入狀態(tài)m'的均值時(shí)間E3(T)。由一維生滅過(guò)程的瞬態(tài)分析,可得以下方程組。其中,Pi(t)表示在t時(shí)刻系統處于狀態(tài)i的概率。
這是一個(gè)四元常系數線(xiàn)性微分方程組,可通過(guò)消元法消為一元線(xiàn)性微分方程,解之,然后可以求出其他各元的解。再根據邊界條件,可以求出各解中的系數。系統的邊界條件為
。 。
而E3(T)可表示為:
。。
為了求出E3(T)的具體值,還必須求出a3的值。限于篇幅,不加證明的給出如下求am的定理。
定理:如果一個(gè)擁有n個(gè)節點(diǎn)的機群系統,含kn個(gè)互不相同的數據塊,每個(gè)數據塊都有m個(gè)備份,每個(gè)備份隨機地分布于機群系統中不同的節點(diǎn)上,那么當系統中出現有s-1個(gè)節點(diǎn)失效的時(shí)候,無(wú)數據塊丟失;而當系統中出現有s個(gè)節點(diǎn)失效的時(shí)候,系統中出現某個(gè)數據塊無(wú)法挽回地丟失的概率為, 其中
, 并且s>=1。
根據此定理,求出當n=1000, m=3, k=100時(shí)a3=0.0006。
根據以上推導,可求出E3(T)在不同條件下的值,得到在n=1000, l=1/(24*3600) (/秒)的配置下,當lb=0.1(/秒)時(shí),E3(T)=319天;當lb=0.05(/秒)時(shí),E3(T)=86天;當lb=0.01(/秒)時(shí),E3(T)=2天。類(lèi)似地,可求出m=2時(shí)系統進(jìn)入狀態(tài)m'的均值時(shí)間E2(T),得到在n=1000, l=1/(24*3600) (/秒)的配置下,當lb=0.1(/秒)時(shí),E2(T)=1.3小時(shí);當lb=0.05(/秒)時(shí),E2(T)=0.73小時(shí);當lb=0.01(/秒)時(shí),E2(T)=0.27小時(shí)。
分析以上數據可以得到兩個(gè)結論。第一,三個(gè)備份的系統比兩個(gè)備份的,能顯著(zhù)地提升系統的MTTF。在通常配置下,三個(gè)備份的系統的MTTF可達幾十天;而兩個(gè)備份的系統的MTTF只能在1小時(shí)左右。第二,數據塊的轉移時(shí)間顯著(zhù)地影響系統的MTTF,轉移時(shí)間越短,系統的MTTF越長(cháng)。
4仿真實(shí)驗
下面,通過(guò)仿真實(shí)驗來(lái)驗證上面的結論。仿真實(shí)驗中的主要參數和限制條件如下。狀態(tài)塊總數與節點(diǎn)總數之比為rchunk=100,節點(diǎn)失效速率l=1/(24小時(shí)),節點(diǎn)恢復速率m=1/(24小時(shí))。在進(jìn)行狀態(tài)轉移時(shí),源節點(diǎn)和目標節點(diǎn)的選擇策略:源節點(diǎn),必須包含該狀態(tài)塊的備份,同時(shí)其上正在進(jìn)行拷貝的狀態(tài)塊數目必須最??;目標節點(diǎn),從所有不含該狀態(tài)塊的備份的節點(diǎn)中隨機選取,同時(shí)其上所存儲的狀態(tài)塊數目不能超過(guò)平均值的tcap=1.3。為保證狀態(tài)塊拷貝不影響系統的正常服務(wù),人為限制正在進(jìn)行拷貝的節點(diǎn)數目不超過(guò)機群系統中節點(diǎn)總數的tratio=40%。為了同樣的目的,人為限制狀態(tài)塊拷貝只占用網(wǎng)絡(luò )帶寬的一半;若有多個(gè)狀態(tài)塊在向外輸出,則它們分享帶寬。網(wǎng)絡(luò )帶寬為100Mb/s,一個(gè)狀態(tài)塊大小為64M。為了使新加入的節點(diǎn)不在短時(shí)間里收到大量的新備份,人為限制每個(gè)節點(diǎn)正在進(jìn)行拷貝的狀態(tài)塊數目不超過(guò)tcopy=1。實(shí)驗結果,如圖2所表示。這些限制條件均來(lái)自實(shí)際系統。
圖2不同備份數下的系統MTTF
評論