盤(pán)點(diǎn)網(wǎng)絡(luò )存儲技術(shù) 你都了解嗎
在以數據為中心的信息時(shí)代,存儲已成為IT基礎設施的核心之一。數據存儲已經(jīng)成為繼互聯(lián)網(wǎng)熱潮之后的又一次技術(shù)浪潮,它將網(wǎng)絡(luò )帶入了以數據為中心的時(shí)代。
本文引用地址:http://dyxdggzs.com/article/201808/385500.htm由于近年來(lái)C/S計算模型的廣泛采用,服務(wù)器都帶有自己的存儲系統,信息分散到各個(gè)服務(wù)器上,形成了所謂的“信息孤島”,不利于信息整合與數據共享。而網(wǎng)絡(luò )存儲就是一種利于信息整合與數據共享,且易于管理的、安全的新型存儲結構和技術(shù)。目前,網(wǎng)絡(luò )存儲已經(jīng)成為一種新的存儲技術(shù),本文將從體系結構的角度簡(jiǎn)述目前的存儲系統。
直接連接存儲DAS
直接連接存儲DAS(Direct Attached Storage)是對SCSI總線(xiàn)的進(jìn)一步發(fā)展。它對外利用SCSI總線(xiàn)通道和多個(gè)主機連接,解決了SCSI卡只能連接到一個(gè)主機上的缺陷。對內利用SCSI總線(xiàn)通道或FC通道、IDE接口連接多個(gè)磁盤(pán),并實(shí)現RAID技術(shù),形成一個(gè)磁盤(pán)陣列,從而解決了數據容錯、大存儲空間的問(wèn)題。
DAS是以服務(wù)器為中心的存儲體系結構,難以滿(mǎn)足現代存儲應用大容量、高可靠、高可用、高性能、動(dòng)態(tài)可擴展、易維護和開(kāi)放性等多方面的需求。解決這一問(wèn)題的關(guān)鍵是將訪(fǎng)問(wèn)模式從以服務(wù)器為中心轉化為以數據和網(wǎng)絡(luò )為中心,實(shí)現擴展容量、增加性能和延伸距離,尤其是實(shí)現多個(gè)主機數據的共享,這推動(dòng)了存儲與計算的分離,即網(wǎng)絡(luò )存儲的發(fā)展。
網(wǎng)絡(luò )附屬存儲NAS
NAS(附網(wǎng)存儲系統)系統是用一個(gè)裝有優(yōu)化的文件系統和瘦操作系統的專(zhuān)用數據存儲服務(wù)器,提供跨平臺的文件共享功能。NAS產(chǎn)品與客戶(hù)之間的通訊采用NFS(Network File System)協(xié)議、CIFS(Common Internet File System)協(xié)議,這些協(xié)議運行在IP之上。。
盡管NAS集成了系統、存儲和網(wǎng)絡(luò )技術(shù),具有擴展性強、使用與管理簡(jiǎn)單、跨平臺文件共享、性能優(yōu)化等特點(diǎn)。然而,NAS系統也有其潛在的局限性。首先是它受限的數據庫支持,NAS文件服務(wù)器不支持需大量依賴(lài)于數據庫處理結果的應用(塊級應用)。其次是缺乏靈活性,它是一種專(zhuān)用設備。最后,NAS備份與恢復的實(shí)現相當困難。
存儲區域網(wǎng)SAN
SAN(存儲區域網(wǎng))是通過(guò)專(zhuān)用高速網(wǎng)將一個(gè)或多個(gè)網(wǎng)絡(luò )存儲設備(如磁盤(pán)陣列RAID)和服務(wù)器連接起來(lái)的專(zhuān)用存儲系統。
SAN以數據存儲為中心,采用可伸縮的網(wǎng)絡(luò )拓撲結構,提供SAN內部任意節點(diǎn)之間的多路可選擇的數據交換,并且將數據存儲管理集中在相對獨立的存儲區域網(wǎng)內,實(shí)現最大限度的數據共享和數據優(yōu)化管理,以及系統的無(wú)縫擴充。正是由于光纖通道技術(shù)的發(fā)展,使得SAN得以支持遠距離通信、易于擴展、能夠解決網(wǎng)絡(luò )數據的存儲備份、高可用性、災難恢復等有關(guān)問(wèn)題,它可以提供高性能數據管道和共享的集中管理的存儲設備。因此采用網(wǎng)絡(luò )和通道技術(shù)相互融合的光纖通道接口的SAN將LAN上的存儲轉換到主要由存儲設備組成的專(zhuān)用網(wǎng)絡(luò )上,使得數據的訪(fǎng)問(wèn)、備份和恢復不影響LAN的性能,在大量數據訪(fǎng)問(wèn)時(shí),不會(huì )大幅度降低網(wǎng)絡(luò )性能。
SAN主要用于存儲量大的工作環(huán)境,并且SAN的適用性和通用性較差,在系統的安裝和升級方面效率不高,且由于SAN使用專(zhuān)用網(wǎng)絡(luò )(一般為光纖網(wǎng)絡(luò )),相應的設備價(jià)格昂貴,總體實(shí)現費用較高,局限于大中型應用。
NAS和SAN技術(shù)都體現了數據存儲從傳統的服務(wù)器中獨立出來(lái)的思想,它們是網(wǎng)絡(luò )存儲領(lǐng)域中的兩個(gè)發(fā)展方向。隨著(zhù)NAS和SAN之間的界限越來(lái)越模糊,其中更重要的區別可能就是在NAS/SAN混合系統中所采用的協(xié)議了:IP、光纖通道,或者iSCSI等。
IP存儲
傳統的SAN一般采用光纖通道技術(shù),其成本高,距離受限制,因此基于IP的存儲正成為一個(gè)新的熱點(diǎn),主要有FCIP(Fibre Channel over IP)、iFCP(Internet Fibre Channel Protocol)、mFCP(Metro Fibre Channel Protocol)、iSCSI(Internet SCSI)等技術(shù)。
上述協(xié)議有一個(gè)非常重要的共同點(diǎn):都能充當SCSI命令集的傳輸機制。通過(guò)IP存儲介質(zhì)與存儲設備通信的主機仍能表達SCSI的含意。而iSCSI則是從主機到存儲設備的整個(gè)傳輸鏈路就是一條IP鏈路,沒(méi)有采用光纖通道,基于主機的應用通過(guò)IP與網(wǎng)絡(luò )存儲設備通信。iSCSI保持了SCSI命令集的原狀,同時(shí)用IP取代了傳輸協(xié)議。但由于iSCSI通過(guò)映射至IP來(lái)保留SCSI命令集,存在延時(shí)問(wèn)題,已有專(zhuān)門(mén)的iSCSI芯片組把轉換代碼部署在硬件當中。IP-SAN的優(yōu)勢在于:容易擴展成超大規模的存儲網(wǎng)絡(luò );不必受光纖通道SAN的距離限制,連接在IP網(wǎng)絡(luò )上的服務(wù)器都能享用網(wǎng)絡(luò )存儲服務(wù);連接靈活多樣,廉價(jià)成熟的網(wǎng)絡(luò )架構成本,使得高端也能達到Gbps速率,有較高的性能價(jià)格比。
集群存儲
由于目前一些存儲應用受容量可擴展性、性能可擴展性、可用性、可管理性的挑戰,“催生”了許多存儲集群系統的產(chǎn)生。集群存儲是將每個(gè)存儲設備作為一個(gè)存儲節點(diǎn),通過(guò)高速互聯(lián)網(wǎng)絡(luò )連接起來(lái),將數據分散開(kāi)存儲在多臺獨立的設備上,這些設備可以獨立運作,相互之間又可以合作。每個(gè)I/O節點(diǎn)不僅可以訪(fǎng)問(wèn)本節點(diǎn)的存儲空間,還可以訪(fǎng)問(wèn)其他節點(diǎn)的存儲空間。所有存儲節點(diǎn)的空間以一個(gè)虛擬磁盤(pán)的方式提供給客戶(hù)端用戶(hù)。組成集群存儲可以是塊級別的SAN集群、文件級別的NAS集群和并行文件系統的集群,它們的訪(fǎng)問(wèn)、特征與適用環(huán)境參見(jiàn)表1。
集群存儲有效地提升了存儲設備的容量可擴展性、性能穩定性及系統可管理性。集群存儲非常適合那些持續增長(cháng)的所有規模的不同環(huán)境,實(shí)現即時(shí)供應(Just-in-time)存儲,避免破壞性升級和增加管理的復雜性。在大型數據中心或高性能計算中心的集群存儲解決方案,具有高性?xún)r(jià)比,簡(jiǎn)單、易于維護,高可靠性/可用性,具有非常高的整合帶寬等優(yōu)點(diǎn)。集群存儲最典型系統是Google體系結構,它是大量機器內硬盤(pán)的組合,含899個(gè)機架(每架80臺PC,每臺PC有2個(gè)硬盤(pán)),共79,112臺PC機,有158,224個(gè)硬盤(pán), 總容量為6180 TB。
對等(P2P)存儲
對等結構(P2P)從用戶(hù)的使用方式來(lái)看,系統中每個(gè)用戶(hù)既向其他用戶(hù)提供資源,也從其他用戶(hù)那里獲取資源。從體系結構來(lái)看,無(wú)中心結構,結點(diǎn)之間對等,通過(guò)互相合作來(lái)完成用戶(hù)任務(wù)。P2P結構的優(yōu)點(diǎn)表現在:沒(méi)有中心結點(diǎn),不易形成系統瓶頸、不易受攻擊,可擴展性好,自組織性好。
用P2P的方式在廣域網(wǎng)中構建大規模分布式存儲系統,將很多機器用對等的方式組織起來(lái)共同為用戶(hù)提供超大容量的數據存儲服務(wù),存儲結點(diǎn)來(lái)自于存儲服務(wù)方,用戶(hù)使用存儲空間并付費,用戶(hù)還通過(guò)該平臺自主尋找其他結點(diǎn)進(jìn)行數據備份和存儲空間交換。
P2P存儲與SAN的應用特點(diǎn)不同。前者主要強調可用性,而SAN主要面向的是高性能;P2P存儲易于維護、可擴展好、自配置功能強,特別是P2P存儲可以大量加盟的PC機和服務(wù)器中的存儲器來(lái)組合成存儲系統,提供高帶寬的視頻服務(wù)和其他共享服務(wù)。
集群存儲與P2P存儲都是分布式存儲。前者多在大型數據中心或高性能計算中心使用,后者是構建更大規模的分布式存儲系統,可以跨多個(gè)大型數據中心或高性能計算中心使用。
網(wǎng)格存儲
所有的存儲、服務(wù)器和網(wǎng)絡(luò )資源都被虛擬為一個(gè)資源池,并將其視作共享資源,這個(gè)資源池就是存儲網(wǎng)格。存儲網(wǎng)格的關(guān)鍵是虛擬化與統一性管理問(wèn)題。
存儲網(wǎng)格既可應用于SAN環(huán)境,又可應用于NAS環(huán)境,它提供快速簡(jiǎn)單的對于容量、性能、服務(wù)質(zhì)量和/或連接協(xié)議的可升級性,可對公司所有數據進(jìn)行統一查看和管理,遠遠超出當前有限的虛擬化實(shí)現途徑,還可優(yōu)化分布式企業(yè)遠程數據訪(fǎng)問(wèn)的性能。存儲網(wǎng)格架構可實(shí)現數據庫和企業(yè)之間更緊密的應用整合,提供更高的數據保護,并可基于有關(guān)規定更簡(jiǎn)單地管理數據資源。這些優(yōu)勢極大降低了用戶(hù)在購買(mǎi)、擴容和管理時(shí)的費用。
面向對象的存儲
對象存儲模型綜合了NAS和SAN結構的特點(diǎn),存儲對象具有文件和塊二者的優(yōu)點(diǎn):像數據塊一樣在存儲設備上被直接訪(fǎng)問(wèn),通過(guò)一個(gè)對象接口,像文件一樣,在不同操作系統平臺上實(shí)現數據共享。在SAN中,定位邏輯和文件系統都位于主機中。而在面向對象的存儲中,存儲空間不再需要運行在主機上的文件系統管理,而由存儲系統自己管理和分配。
一個(gè)存儲對象是關(guān)于一個(gè)存儲設備的邏輯字節集合,它有存儲方法、數據屬性和存儲安全策略等。因此,對象存儲系統在基于文件級的數據布局、服務(wù)質(zhì)量的靈活性和可管理等方面有很大改善。另外,基于對象存儲的最直接效果是將空間管理從存儲應用中剝離,如圖2所示,存儲設備具有自管理特性,包括重新組織數據來(lái)提高性能、調用規則的備份和失敗恢復等。
未來(lái)存儲設備的特性可能包括自配置、自保護、自?xún)?yōu)化、自恢復和自管理。將塊接口用對象來(lái)代替是一個(gè)發(fā)展方向。目前,面向對象的存儲仍然處在標準制定之中,還沒(méi)有得到廣泛的接受。
內容尋址存儲CAS
內容尋址存儲(Content Addressed Storage,CAS)是針對固定內容存儲需求的網(wǎng)絡(luò )存儲技術(shù)。CAS具有面向對象存儲特征,基于磁記錄技術(shù),它按照所存儲數據內容的數字指紋尋址,具有良好的可搜索性、安全性、可靠性和擴展性。CAS、SAN和NAS的區別參見(jiàn)表2。CAS存儲技術(shù)的代表性產(chǎn)品是EMC公司的Centera 系統,目前還具有非常多的局限性。
數據庫只針對的是結構化數據,而大量非結構化的數據管理有更大的存儲需求,而內容管理的對象是以各類(lèi)非結構化數據為主的數字內容。CAS技術(shù)的出現使非結構化數據管理(包括企業(yè)的各種文檔、報表、賬單、網(wǎng)頁(yè)、圖片、傳真、掃描影像,以及大量的多媒體音頻、視頻信息等等的歸檔和查詢(xún))成為存儲業(yè)新的熱點(diǎn)。未來(lái)需要一種新的基于內容管理的存儲系統平臺,它擴展了最新的對象存儲體系結構,支持對象倉儲和聯(lián)邦數據庫技術(shù),支持關(guān)系和 XML作為主要數據模型,并緊密地集成了內容管理服務(wù)、工作流、消息傳遞、分析和其他企業(yè)應用程序服務(wù)。
基于IB的存儲
InfiniBand(IB)是針對處理器和智能I/O設備之間數據流而提出的一種新體系結構,用于在服務(wù)器中取代PCI總線(xiàn)。采用IB技術(shù)支持多處理器集群,將允許服務(wù)器提供更高的帶寬和可擴展能力,并增強了存儲設備擴充的靈活性,并用于支持遠程I/O和遠程存儲器,如圖3所示。IB作為一種能夠為系統與存儲之間提供低延遲和高帶寬的連接解決方案,已經(jīng)為一些用戶(hù)所接受,預期基于IB的存儲將在存儲領(lǐng)域會(huì )占有一席之地。
評論