SAF-TE技術(shù)在磁盤(pán)陣列背板中的實(shí)現
摘 要:在磁盤(pán)陣列中,一般使用背板方式連接硬盤(pán),這樣服務(wù)器可在不關(guān)機的情況下直接更換損壞的硬盤(pán)。在背板設計中采用SAF-TE監控技術(shù)不僅可以隨時(shí)監控硬盤(pán)的好壞、對損壞的硬盤(pán)提供LED指示并報警,同時(shí)還可以實(shí)現對系統風(fēng)扇、溫度及電壓的實(shí)時(shí)監控。本文將以SAF-TE控制器GEM318為例,介紹其在曙光2U服務(wù)器硬盤(pán)熱插拔背板設計中的具體應用。
關(guān)鍵詞:SAF-TE;GEM318;I2C;PCB布線(xiàn)
SAF-TE控制技術(shù)
SAF-TE(SCSI Accessed Fault-Tolerant Enclosure) 是Intel公司提出的一種標準。該標準定義了一組命令,這些命令可用于設置RAID陣列和獲得陣列中磁盤(pán)的狀態(tài)信息,并在實(shí)現對熱插拔磁盤(pán)進(jìn)行管理的同時(shí),為用戶(hù)提供磁盤(pán)陣列的環(huán)境狀態(tài)信息。這樣就在主機、RAID控制器、存儲設備、背板、電源及其它設備間建立了有效的通信途徑。
與以往的背板相比,采用SAF-TE控制技術(shù)的熱插拔背板,具有以下優(yōu)點(diǎn):可進(jìn)行驅動(dòng)器狀況監控并在熱插拔底板上顯示磁盤(pán)驅動(dòng)器的狀態(tài)信息。這就允許客戶(hù)快速地確認并更換一個(gè)已經(jīng)無(wú)效的或者可能有故障的磁盤(pán)驅動(dòng)器。在更換了損壞的硬盤(pán)后,RAID的重建可自動(dòng)進(jìn)行,而無(wú)須再經(jīng)手動(dòng)操作RAID控制器來(lái)完成。在硬盤(pán)的恢復過(guò)程中,不影響系統的服務(wù)。如果沒(méi)有SAF-TE,自動(dòng)重建工作只能是在有備用磁盤(pán)存在的情況下方可完成。由于不需在陣列中放置備用磁盤(pán),使用SAF-TE可實(shí)現磁盤(pán)陣列中適用磁盤(pán)數量的最大化。
電路設計
GEM318 是一款低成本、自完備的熱插拔硬盤(pán)背板管理控制器,只需簡(jiǎn)單的外圍器件就可實(shí)現SAF-TE管理功能。由于其低成本和小封裝的特點(diǎn),使其成為1U和2U服務(wù)器節點(diǎn)背板設計中首選的解決方案。
硬件電路設計
GEM318具有LVDS接口,作為SCSI的一個(gè)目標設備存在,并占一個(gè)ID號,支持SAF-TE 1.0規范。具有一個(gè)I2C接口,當工作在主方式下,可以讀取外部的溫度傳感器LM75和NVRAM AT24C01里面的組態(tài)數據。最多支持8個(gè)SCSI設備,具有8個(gè)LED控制引腳。支持兩個(gè)LM75溫度傳感器,具體設計電路如圖1所示。
硬盤(pán)插拔檢測
該背板支持6塊SCSI硬盤(pán),所以只需將GEM318的DEV_INS5~0這6個(gè)引腳分別連接到背板上6個(gè)SCSI插槽的MATED引腳即可。該引腳正常為高電平,當某個(gè)槽中有硬盤(pán)插入時(shí),硬盤(pán)的MATED引腳會(huì )將相應的DEV_INS引腳電平拉低。這樣,GEM318就依此來(lái)判斷每個(gè)SCSI插槽上硬盤(pán)的插拔狀態(tài)。
當GEM318檢測到某個(gè)DEV_INS引腳出現由高到低的電平跳變后,會(huì )立即使能SCSI總線(xiàn)上的復位信號,使得SCSI設備處于復位狀態(tài)(如圖2所示)。這樣就有效的“屏蔽”了硬盤(pán)插入瞬間對SCSI總線(xiàn)信號的干擾,從而保證了SCSI總線(xiàn)信號的可靠性傳輸。
故障報警及LED指示
GEM318可以把SAF-TE命令寄存器記錄的錯誤信息及時(shí)傳遞給報警輸出引腳FAULT_IN。這樣,GEM318就可隨時(shí)把出錯信息以聲光報警的方式通知給用戶(hù)。
設計中將溫度、風(fēng)扇和電壓檢測電路的邏輯輸出,通過(guò)7411三輸入與門(mén)芯片輸出給GEM318的外部故障輸入引腳G_ALARM(低電平有效),以實(shí)現監控盤(pán)陣工作環(huán)境的目的。
LED7~0輸出引腳用來(lái)驅動(dòng)外部的LED,分別顯示相對應的硬盤(pán)狀態(tài)信息。
LVDS信號接口與ID設置
GEM318支持LVDS信號接口方式,LVDS是電流驅動(dòng)模式,350mV的低電壓擺幅可以提供幾百兆比特的信號傳輸率。使用差分傳輸的方式可以使電磁干擾互相抵消,消除共模噪聲,減少EMI。
GEM318有兩個(gè)ID可選:ID6或ID8。目的是為了當盤(pán)陣中一個(gè)SCSI通道的硬盤(pán)數超過(guò)8時(shí),可采用兩個(gè)GEM318。設計時(shí)將GEM318的ID_ON1+/ID_ON1- 連到SCSI總線(xiàn)上的DB6+/DB6-,將GEM318的ID號設為6。
通過(guò)硬件電路跳線(xiàn)和NVRAM組態(tài)GEM318
GEM318具有很大的設計靈活性,可以在上電時(shí)通過(guò)讀取輸出引腳的電平狀態(tài)和NVRAM中的數據來(lái)配置GEM318的特性。
LED7~0引腳在系統上電時(shí),在GEM318的RESET信號有效期間作為輸入引腳使用。要求RESET信號至少要保持5個(gè)時(shí)鐘周期。
LED7~0上電初期的引腳電平設計時(shí)由上拉或下拉電阻決定,此期間要求驅動(dòng)LED顯示的供電電源LED_VDD暫停供電,以便GEM318能讀到準確的低電平信息。LED_VDD延遲上電的時(shí)間t可通過(guò)調整C31和R22的值來(lái)決定。設計電路如圖3所示,電源時(shí)序如圖4所示。
設計時(shí)NVRAM選用的是AT24C01,上電時(shí)GEM318將從AT24C01的40H存儲單元讀取信息。通過(guò)對AT24C01編程可設置以下選項:Slot的數目,每個(gè)Slot的SCSI ID號,設置溫度傳感器的數目及溫度報警上下限值等。
串行通信設計
GEM318的串行通信接口兼容I2C規范,即可工作在主方式下也可工作在從方式下。工作在主方式下時(shí)可支持多主競爭,在背板設計上預留了I2C插針,這就為外部的控制設備訪(fǎng)問(wèn)盤(pán)陣信息提供了可能。當工作在從方式下時(shí),GEM318有兩個(gè)從地址可選。設計時(shí)將ID_ON1接到SCSI總線(xiàn)上,把GEM318的從地址設為E1H。如果將ID_ON0接到總線(xiàn)則從地址為E3H。
PCB設計
背板要求支持320Mbps的SCSI總線(xiàn)傳輸速率,SCSI總線(xiàn)采用LVDS信號傳輸技術(shù),為保證信號的可靠傳輸,PCB布線(xiàn)至關(guān)重要。印制板的主要技術(shù)參數如下:
1. 尺寸是270mm X 84mm,板厚為2mm。
2. 采用六層板設計,信號從頂層到底層的布局依次為T(mén)OP層,GND層,信號1層,信號2層,信號3層和BOTTOM層。其中信號2層布12V電源,信號3層鋪5V電源。
在布線(xiàn)中應注意以下幾點(diǎn):
1. 優(yōu)先考慮電源和地在系統中的分布。
2. 使TTL信號和LVDS信號相互隔離,最好分布在不同的層。
3. 盡量多使用去耦電容。
4. 大電流回路布線(xiàn)盡量加粗,保持PCB地線(xiàn)層返回路徑盡量寬而短。
5. 對于差分布線(xiàn)采用手動(dòng)布線(xiàn)功能,使差分線(xiàn)對離開(kāi)集成芯片后盡可能地相互靠近。每對差分線(xiàn)的間隔要盡量小,差分對間的長(cháng)度要匹配。這樣能減少反射并能確保耦合到的噪聲為共模噪聲。
6. 進(jìn)行阻抗控制,通過(guò)阻抗設計軟件計算阻抗以確定差分線(xiàn)寬及線(xiàn)間距。
7. 背板上設計終結器電路,以吸收反射信號。
8. 走線(xiàn)時(shí)避免90洌ㄒ苑澇斐勺榪共渙?,記](méi)∠呋?5畢嘰妗?
結語(yǔ)
采用SAF-TE控制技術(shù)設計的SCSI背板,已廣泛應用在曙光的系列產(chǎn)品中。經(jīng)兩年多的實(shí)際運行,證明系統工作可靠,性能穩定,保證了熱插拔硬盤(pán)的安全穩定運行。該控制技術(shù)在產(chǎn)品中的采用,改變了傳統的熱插拔背板只能監控溫度和風(fēng)扇信息,而不能與主機,硬盤(pán)控制器通信的缺陷。為服務(wù)器存儲系統的安全穩定運行提供了有效的保障?!?/p>
參考文獻
1 SCSI Accessed Fault-Tolerant Enclosures Interface and Specification
2 GEM318 Guardian Enclosure Management Controller Data Sheet
3 GEM318 Guardian Management Controller Technical Manual
評論