對象存儲:塊和文件之外的存儲形式
塊是存儲的基礎架構,對塊的管理是簡(jiǎn)單的。從全球第一個(gè)磁盤(pán)存儲技術(shù)50年前誕生到現在,塊的技術(shù)沒(méi)有發(fā)生太大變化。磁盤(pán)工業(yè)生產(chǎn)遍及全球。最近幾年,存儲行業(yè)興起存儲虛擬化和數據整合的新概念,在這些概念和方案中,數據還是以塊的形式通過(guò)網(wǎng)絡(luò )進(jìn)行讀寫(xiě)操作。
塊形式的存儲在滿(mǎn)足數據可擴展性和數據安全性的增長(cháng)方面,日益顯現出其局限性和不足。國際上主要有兩類(lèi)網(wǎng)絡(luò )化存儲架構,它們是通過(guò)命令集來(lái)區分的。
第一類(lèi)是SAN(Storage Area Network)結構,它采用SCSI 塊I/O的命令集,通過(guò)在磁盤(pán)或FC(Fiber Channel)級的數據訪(fǎng)問(wèn)提供高性能的隨機I/O和數據吞吐率,它具有高帶寬、低延遲的優(yōu)勢,在高性能計算中占有一席之地,但是由于SAN系統的價(jià)格較高,且可擴展性較差,已不能滿(mǎn)足成千上萬(wàn)個(gè)CPU規模的系統。第二類(lèi)是NAS(Network Attached Storage)結構,它采用NFS或CIFS命令集訪(fǎng)問(wèn)數據,以文件為傳輸協(xié)議,通過(guò)TCP/IP實(shí)現網(wǎng)絡(luò )化存儲,可擴展性好、價(jià)格便宜、用戶(hù)易管理,如目前在集群計算中應用較多的NFS文件系統,但由于NAS的協(xié)議開(kāi)銷(xiāo)高、帶寬低、延遲大,不利于在高性能集群中應用。
針對Linux集群對存儲系統高性能和數據共享的需求,國際上已開(kāi)始研究全新的存儲架構和新型文件系統,希望能有效結合SAN和NAS系統的優(yōu)點(diǎn),支持直接訪(fǎng)問(wèn)磁盤(pán)以提高性能,通過(guò)共享的文件和元數據以簡(jiǎn)化管理,目前對象存儲系統已成為L(cháng)inux集群系統高性能存儲系統的研究熱點(diǎn),如Panasas公司的Object Base Storage Cluster System系統和Cluster File Systems公司的Lustre等。
基于對象的存儲
在2004年, ANSI 推出了基于對象的存儲設備(OSD)的1.0版本規范。它定義了基于對象的存儲設備的通訊協(xié)議。OSD規范描述了一個(gè) SCSI 命令集合,由他提供一個(gè)高水平的OSD接口。這個(gè)接口允許客戶(hù)端, 比如文件系統和數據庫存放和索引數據。 SNIA’S 技術(shù)工作組當前正在開(kāi)發(fā)OSD 規范的2.0版本,這個(gè)版本年內完成。
一個(gè)OSD設備存放對象,他控制著(zhù)從對象到物理介質(zhì)的映射圖。設備同時(shí)也跟蹤作為屬性的元數據,例如建立時(shí)間標記,從而允許在客戶(hù)端非常容易地共享數據。
可以說(shuō),OSD最大的賣(mài)點(diǎn)在于它結合了SAN的可擴展性和NAS的數據共享。早期的NAS架構的擴展性能并不好,因為所有的元數據的處理都集中在NAS服務(wù)器上。在有限的NAS頭下擴張更多的存儲受到限制,而且這個(gè)時(shí)候,NAS上的元數據處理變成了瓶頸。如果想擴展,就需要增加更多的NAS服務(wù)器,但是此時(shí)的管理成為頭疼的事情,因為數據是分散的, 這就是我們常說(shuō)到的“NAS 孤島”
OSD的能力在于它將客戶(hù)端和OSD設備直接聯(lián)系起來(lái),并不需要中間環(huán)節管理元數據。Panasas 公司,全球第一家提供商用OSD產(chǎn)品的公司,同時(shí)提供面向對象的存儲和并行文件系統。Panasas 公司的 DirectFLOW 的設計,客戶(hù)端從帶外管理的控制刀片得到目標的分布和安全屬性。所有的數據流都直接從OSD存儲刀片到客戶(hù)端。盡管商用的OSD產(chǎn)品還只是鳳毛麟角,但是OSD技術(shù)還是在日新月異?!∥鹘莺虸BM已經(jīng)展示了OSDc產(chǎn)品?!P已經(jīng)和開(kāi)放源代碼廠(chǎng)家 Lustre 文件系統合作,使用OSD作為他的StorageWork 可擴展文件系統的重要部分。
對于對象存儲來(lái)講,不光是解決了數據存儲的問(wèn)題,同時(shí)它還解決了數據安全性的問(wèn)題。存儲通常已經(jīng)依賴(lài)于客戶(hù)端和私有網(wǎng)絡(luò )的認證來(lái)保護系統的安全性,不管在文件服務(wù)器內用的是FC SAN或SCSI陣列。對象存儲體系結構在每一個(gè)級別上都提供了安全性:存儲系統對存儲設備的認證;存儲系統對計算節點(diǎn)的認證;存儲系統對計算節點(diǎn)命令的認證;所有命令都經(jīng)CRC的完整性檢查;數據和命令經(jīng)由IP的私有性。這樣的安全水平能給用戶(hù)以信心,他們可以用更經(jīng)濟高效,可管理并容易訪(fǎng)問(wèn)的網(wǎng)絡(luò ),如以太網(wǎng),作為存儲的傳輸工具,同時(shí)還提高了整個(gè)存儲體系的安全性。
“對象存儲設備并不適合所有的用戶(hù)?!?Panasas公司的CTO Garth Gibson博士說(shuō)。經(jīng)過(guò)幾年的努力,Panasas 在政府,科研,能源,媒體和金融服務(wù)有了很多非常成功的案例?!癙anasas 是使用面向對象的存儲集群,來(lái)解決計算集群的并行存儲的問(wèn)題”。高性能計算和存儲專(zhuān)家胡家鎏教授說(shuō)。
高性能計算領(lǐng)域
對象存儲體系結構提供了一個(gè)帶有NAS系統的傳統的文件共享和管理特征的單系統映象(single-system-image)文件系統,并改進(jìn)了SAN的資源整合和可擴展的性能。這種性能,可擴展性,可管理性以及安全性的結合,只能通過(guò)在存儲體系結構上的重大革命才能被完成。
第一個(gè)支持對象體系結構的產(chǎn)品現在已經(jīng)問(wèn)世,它就是Panasas ActiveScale Storage Cluser (存儲集群)。
此產(chǎn)品已經(jīng)被部署在國家實(shí)驗室,地震資料處理機構,以及生物技術(shù)組織,它們都在用Linux集群去解決關(guān)鍵的科學(xué)問(wèn)題,這些問(wèn)題在過(guò)去是用巨型超級計算機也不能解決的。它們都期盼能解決需要高性能,可擴展的共享存儲才能解決的新問(wèn)題,這種存儲在Panasas的存儲體系之前,在市場(chǎng)上是沒(méi)有的。Panasas存儲集群及基于對象的存儲體系結構已經(jīng)展示了,它們能迎接由Beowolf/Linux集群計算體系結構提出的挑戰,在那里,傳統的基于SAN和DAS的產(chǎn)品都會(huì )敗下陣來(lái)。Panasas 在美國能源部(U.S.Department of Energy:DOE)、Lawrence Livermore 國家實(shí)驗室,Los Alamos國家實(shí)驗室,Sandia 國家實(shí)驗室,Pacific Northwest國家實(shí)驗室的高性能計算系統中已得到了初步的應用。在全球范圍內,Panasas 對象存儲集群系統的性能在企業(yè)級HPC集群的關(guān)鍵應用中得以淋漓體現和發(fā)揮。
OSD將來(lái)會(huì )從HPC存儲過(guò)渡成主流的企業(yè)級存儲嗎?我們拭目以待。試想,當年SUN公司的NFS不就是從最早的技術(shù)環(huán)境走到主流商業(yè)應用的最前線(xiàn)的嗎?
對象存儲成為主流
無(wú)論OSD是從HPC走到企業(yè)級應用中,或是通過(guò)其他方式,均面臨需要被企業(yè)級的用戶(hù)所接受這樣的事實(shí)。從傳統的存儲變成OSD 存儲,需要在多個(gè)層面上作改變,這包括,存儲設備,存儲網(wǎng)絡(luò ),文件系統和數據庫。
OSD 面臨著(zhù)巨大的機遇。如Garth Gibson博士所講,大規模并行數據存儲的問(wèn)題通過(guò)數據對象,和屬性可以得到解決。在這個(gè)時(shí)候,對象存儲的特性才得以發(fā)揮。而這些都是基于塊的存儲所不能解決的。
對象存儲可以以這種方式使用而與應用無(wú)關(guān)。 應用系統可以和以前使用文件導向的系統一樣使用,所有的工作通過(guò)文件系統實(shí)現對文件的存取。這個(gè)時(shí)候,應用直接存儲數據對象而不是向文件系統寫(xiě)數據。
對象存儲自誕生的那一天起已經(jīng)表現出其巨大的活力,它可以提供數據安全,容易的數據共享,強大的可擴展功能,完全具備走向企業(yè)級數據中心的能力。我們很高興地看到,對象存儲的國際標準已經(jīng)制定,很多全球一線(xiàn)的存儲廠(chǎng)商和服務(wù)器廠(chǎng)家均加入到此陣營(yíng)中。各個(gè)廠(chǎng)家的對象存儲產(chǎn)品已經(jīng)或即將面世。但是,同時(shí)我們也看到,對象存儲全面取代傳統的塊存儲還需時(shí)日。
評論