基于網(wǎng)絡(luò )系統可靠性的設計
1、基于網(wǎng)絡(luò )測試環(huán)境,接入測試儀器,將流量發(fā)生器端到端接入網(wǎng)絡(luò )系統。儀器端口分別連接網(wǎng)絡(luò )系統的接入層和出口,以保證被測流量路徑貫通整個(gè)網(wǎng)絡(luò )。
2、在測試儀器的Port A端口設定速率穩定的流量,目的地址為Port B端口。在Port B端口設定速率穩定的流量,目的地址為Port A端口。由于上下行路徑遷移時(shí),上下行的路由等各類(lèi)協(xié)議的熱備表項不同,涉及的協(xié)議收斂也可能不同,所以務(wù)必設定雙向流量,以檢測上行和下行流量路徑的恢復時(shí)間。
3、確保設定的上下行流量路徑通過(guò)需要模擬的故障點(diǎn)節點(diǎn),避免測試無(wú)效。
4、啟動(dòng)流量發(fā)送與接收,開(kāi)始統計發(fā)送的流量和接收的流量。
5、模擬節點(diǎn)故障,網(wǎng)絡(luò )系統自動(dòng)檢測并恢復。
6、停止發(fā)送流量。根據發(fā)送和接收的流量,計算得出系統流量路徑恢復時(shí)間。
公式為:Time=(發(fā)送報文數量-接收報文數量)/報文發(fā)送速率(pps)。
注意:報文發(fā)送速率以M/G為單位時(shí),計算需考慮以太網(wǎng)報文的前導碼和幀間隙,公式為:Time=(發(fā)送報文數量-接收報文數量)*( 報文字節*8+8*8+96)/報文發(fā)送速率(M/G)。通過(guò)計算得出上下行流量路徑的恢復時(shí)間。
測試時(shí)還需注意以下細節:
1、故障模擬操作方式要考慮全面。例如用命令行shutdown端口和拔掉網(wǎng)線(xiàn)操作導致的測試結果往往會(huì )不同;光纖的單通與通常的鏈路down表現也會(huì )不同等。
2、不僅要測試主設備/鏈路切換到備用,還要測試主設備/鏈路恢復正常后,網(wǎng)絡(luò )系統的表現。
3、每項測試需至少測試三次得到平均值。并對得到尖峰和低谷進(jìn)行分析,需要時(shí)重復更多測試以獲取穩定數據。
4、始終關(guān)注測試流量路徑是否經(jīng)過(guò)故障節點(diǎn),是否按照預期切換,保證測試結果的準確性。
4 驗證HA(High Availability)特性的組合部署功能
網(wǎng)絡(luò )系統中的協(xié)議配置對系統的穩定性、負荷和恢復時(shí)間有重大影響。例如對OSPF的hello time設置過(guò)小,會(huì )加重網(wǎng)絡(luò )中控制平面處理負擔,并容易產(chǎn)生路由振蕩。但是過(guò)大也會(huì )導致故障時(shí)系統恢復時(shí)間無(wú)法達到要求。因此在測試中可根據不同網(wǎng)絡(luò )的要求,取得一個(gè)性?xún)r(jià)比最高的平衡。
當各類(lèi)為保證網(wǎng)絡(luò )系統高可靠運行的協(xié)議在一個(gè)網(wǎng)絡(luò )系統中應用時(shí),就使這種組合更加復雜,這些特性包括鏈路聚合、MSTP、RRPP、BFD、GR、VRRP、ECMP、IRF等。
因此,測試不僅僅需要驗證這些特性是否在發(fā)揮作用,同時(shí)測試過(guò)程也是一個(gè)網(wǎng)絡(luò )參數調優(yōu)過(guò)程。在測試中通過(guò)不斷調整協(xié)議配置參數,以獲取網(wǎng)絡(luò )系統可靠性最佳配置。這個(gè)調優(yōu)過(guò)程既要計算獲取網(wǎng)絡(luò )故障恢復時(shí)間,又要監控網(wǎng)絡(luò )系統各個(gè)節點(diǎn)的運行狀況。例如在滿(mǎn)足網(wǎng)絡(luò )恢復時(shí)間要求基礎上,監控參數配置會(huì )影響的CPU占用率、內存是否正常,Console是否能響應,轉發(fā)是否正常,OSPF收斂及路由變化等等,綜合得出結論。
5 從端到端對網(wǎng)絡(luò )系統進(jìn)行各類(lèi)攻擊測試
此類(lèi)測試往往融合在Duration測試中共同完成。使用測試儀器公司、開(kāi)源軟件、自行開(kāi)發(fā)的各類(lèi)異常報文攻擊工具,可以實(shí)現對網(wǎng)絡(luò )系統的安全漏洞、健壯性的綜合測試。
結束語(yǔ)
網(wǎng)絡(luò )系統方案的可靠性測試的所有測試內容,都需要在整網(wǎng)環(huán)境下執行,以保證網(wǎng)絡(luò )系統的復雜關(guān)聯(lián)性,互相影響得到充分驗證。網(wǎng)絡(luò )系統的可靠性測試是一種灰盒測試,不僅僅要進(jìn)行端到端的測試,還要深入關(guān)注到各個(gè)節點(diǎn)的運行狀態(tài),流量和協(xié)議控制層面的脈絡(luò )運行狀態(tài)。要做好各類(lèi)故障的分類(lèi)分析,充分考慮客戶(hù)環(huán)境的復雜性和客戶(hù)行為,對網(wǎng)絡(luò )系統的高可靠相關(guān)特性深入理解,在驗證中優(yōu)化配置參數,得到最優(yōu)最可靠的網(wǎng)絡(luò )系統。
評論