網(wǎng)絡(luò )存儲器的設計
高性能工作站和PC技術(shù)的發(fā)展運用以及高性能網(wǎng)絡(luò )技術(shù)的出現和發(fā)展,使得計算機集群系統在性能價(jià)格比、可擴展性、可用性、可靠性等方面都具有傳統的大型機和對稱(chēng)多處理系統所無(wú)法比擬的優(yōu)勢。
計算機集群系統就是指將一系列的同構或異構的計算機通過(guò)高速網(wǎng)絡(luò )連接在一起,來(lái)協(xié)同完成特定任務(wù)的功能更加強大的計算機系統。集群系統采用的操作系統主要有VMS、UNIX、WindowsNT和Linux。集群是一種并行或分布式的處理系統,由多臺互聯(lián)的獨立計算機(稱(chēng)為節點(diǎn))整合而成,像一個(gè)單獨的計算資源一樣協(xié)同工作。集群的節點(diǎn)可以是PC、工作站或者對稱(chēng)多處理機(SMP),每個(gè)節點(diǎn)都擁有自己的CPU、內存、I/0設備和操作系統,可以提供大量的冗余設備來(lái)保證集群系統的高可用性。集群的計算能力隨著(zhù)節點(diǎn)數量的增加而線(xiàn)性增加(如圖1)。
1 網(wǎng)絡(luò )存儲器技術(shù)的產(chǎn)生
隨著(zhù)基于計算機集群系統的應用的不斷擴大,對整個(gè)系統性能的要求也就越來(lái)越高,越來(lái)越復雜的計算任務(wù)常常需要用到大量的數據,因此數據的I/0操作性能就成了影響計算機集群系統整體性能的一個(gè)重要指標。根據系統平衡設計原理,系統使用最快部件所能達到的加速比受限制于最慢的系統部件,而目前限制計算機集群系統整體性能的主要因素就來(lái)自于計算機系統中的磁盤(pán)的I/O瓶頸。因此,提高計算機系統中磁盤(pán)的I/O性能就成了提高計算機集群系統整體性能所需要解決的首要問(wèn)題。
通過(guò)分析計算機集群系統的資源優(yōu)勢,我們發(fā)現:一方面,由于網(wǎng)絡(luò )技術(shù)的高速發(fā)展,網(wǎng)絡(luò )通訊延遲越來(lái)越小,網(wǎng)絡(luò )訪(fǎng)問(wèn)比本地磁盤(pán)訪(fǎng)問(wèn)的速度快得多。另一方面,整個(gè)計算機集群系統內部的全部?jì)却媸且粋€(gè)容量很大的資源。如果利用計算機集群內其它節點(diǎn)的空閑內存來(lái)作為本地節點(diǎn)的虛擬內存或文件緩存,可以大幅度節省磁盤(pán)訪(fǎng)問(wèn)時(shí)間,從而緩解磁盤(pán)的I/0瓶頸所帶來(lái)的問(wèn)題。這種使用計算機集群系統內的節點(diǎn)的主存提高計算機系統I/0性能的技術(shù)就稱(chēng)為網(wǎng)絡(luò )存儲器技術(shù)。
伴隨著(zhù)高性能網(wǎng)絡(luò )技術(shù)的出現和普及,計算機系統在傳統的存儲器層次中增加了一個(gè)新的層次一網(wǎng)絡(luò )存儲器(Net―work Memory)。計算機的性能依賴(lài)于系統內處理器與存儲器之間數據交換的速度,網(wǎng)絡(luò )存儲器正是通過(guò)提高處理器與存儲器之間的數據交換的速度來(lái)提高計算機系統性能的,并進(jìn)而提高整個(gè)計算機集群系統的性能。
2 計算機存儲結構的變化
在計算機存儲結構當中,存儲器的用途是多種多樣的,如寄存器、高速緩存、主存儲器和磁盤(pán)等。憑借高速緩存和操作系統對存儲器的管理與分配等技術(shù),使得整個(gè)存儲系統的速度接近于系統內速度最快的那個(gè)存儲器,容量接近于容量最大的那個(gè)存儲器。存儲結構的性能由各層次的有效存取時(shí)間決定,它依賴(lài)于相鄰層次的命中率、訪(fǎng)問(wèn)頻率和存取速度比。命中率越高,訪(fǎng)問(wèn)頻率越低,則性能越高。在命中率和訪(fǎng)問(wèn)頻率一定的情況下,下一層次的存儲器的訪(fǎng)問(wèn)速度越快,則性能越高。
2.1 傳統的計算機存儲結構
在傳統的計算機存儲結構中(如圖2),以主存儲器為分界線(xiàn),主要可以分為上下兩層,上層是由外部高速緩存和主存儲器構成的高速緩存存儲系統,下層則是由磁盤(pán)或磁帶等大容量存儲設備構成的存儲系統。
隨著(zhù)集群技術(shù)的普及與廣泛應用,低速磁盤(pán)與高速內存之間的速度瓶頸問(wèn)題就顯得尤為突出,有必要尋找一種辦法來(lái)緩解內存與磁盤(pán)之間的速度不匹配問(wèn)題。
要緩解這個(gè)矛盾,有三種辦法。第一,提高磁盤(pán)自身的存取速度。而這需要大量的資金與精力的投入,在目前看來(lái),是不現實(shí)的,也是不可取的。第二,像解決高速處理器與內存的速度瓶頸問(wèn)題一樣,在本地主存儲器和本地磁盤(pán)之間也插入一種類(lèi)似于高速緩存的存儲介質(zhì)。第三,使用網(wǎng)絡(luò )空閑內存代替本地磁盤(pán),與本地主存儲器進(jìn)行數據交換。目前高速發(fā)展的網(wǎng)絡(luò )互聯(lián)技術(shù)使得后兩種辦法成為可能,那就是網(wǎng)絡(luò )存儲器。
2.2 具有網(wǎng)絡(luò )存儲器的計算機存儲結構
應用了網(wǎng)絡(luò )存儲器的計算機存儲結構發(fā)生了改變,如圖3所示,對于第二種解決方法,網(wǎng)絡(luò )存儲器在主存儲器和磁盤(pán)之間充當了一個(gè)緩存的角色,這樣可以有效地緩解內存和磁盤(pán)之間速度瓶頸的問(wèn)題。對于第三種解決方法,網(wǎng)絡(luò )存儲器在計算機存儲結構中的位置會(huì )有相應的變化。
3 網(wǎng)絡(luò )存儲器的可行性分析
為了考查實(shí)際情況下的網(wǎng)絡(luò )存儲器,可以考查一個(gè)工作站集群,這個(gè)集群有100個(gè)工作站,每個(gè)工作站各有一個(gè)處理器,內存為64MB或128MB,硬盤(pán)為2GB或4GB。工作站以155Mb/s的ATM連接,典型的延遲是20微秒,帶寬為15Mb/s。這種環(huán)境下,很多工作站上裝載了用戶(hù)的應用程序以及正在使用的集群資源(CPU、內存、硬盤(pán)、網(wǎng)絡(luò ))。根據統計情況,在給定的時(shí)間內,仍有相當多的資源沒(méi)有被利用。在夜間,甚至有80%~90%的工作站都被閑置著(zhù),即使在一天中最忙的時(shí)候,仍有三分之一的工作站完全未用,通常晚上有超過(guò)l千兆字節的存儲器空閑。在任何時(shí)間,在50臺機器的網(wǎng)絡(luò )中有30臺是空閑的。
圖4是希臘計算機科學(xué)學(xué)院(ICS)計算機結構與VLSI系統小組提出的模型,該模型是一個(gè)由16臺工作站組成的共800M主存的集群。由圖4可以看出,絕大多數時(shí)間集群內空閑內存都超過(guò)了700MB,尤其在夜間和周末。
評論