適用于超大規模數據中心的高效 100G/400G 光端機解決方案
作者 / Rang-Chen (Ryan) Yu Molex業(yè)務(wù)發(fā)展副總裁,Molex 旗下 Oplink 公司光電子解決方案業(yè)務(wù)總經(jīng)理兼 100G Lambda MSA 聯(lián)合主席
本文引用地址:http://dyxdggzs.com/article/201807/389571.htm摘要:介紹了適用于超大規模數據中心的高效 100G/400G 光端機解決方案。
全球網(wǎng)絡(luò )數據中心的流量在十年來(lái)一直保持高速增長(cháng),在可預見(jiàn)的未來(lái)尚無(wú)任何減弱的跡象。智能手機及其他移動(dòng)設備、社交媒體與應用、流媒體視頻、增強現實(shí)與虛擬現實(shí)日益普及,正在吸引著(zhù)越來(lái)越多的新用戶(hù),每位用戶(hù)持有的設備數量保持增長(cháng),并且每臺設備使用的數據量也在不斷攀升,這樣,數據中心的流量就發(fā)生了顯著(zhù)的提升。據分析師預測,截至 2020 年,全球連接到互聯(lián)網(wǎng)的設備數量將達到 2000 億臺。近期的證據表明,逐步走向成熟的消費電子產(chǎn)品市場(chǎng)可能只是冰山一角。云計算和機器間的部署中數據帶寬的增長(cháng)速度正在超過(guò)消費者的數據通信速率,推動(dòng)著(zhù)對大容量數據中心基礎設施的巨大需求。
數據中心和光學(xué)互連的增長(cháng)趨勢
在過(guò)去的十年間,AWS、微軟、谷歌和臉書(shū)之類(lèi)的頂尖互聯(lián)網(wǎng)站公司一直都忙于部署規模越來(lái)越大的數據中心,滿(mǎn)足客戶(hù)的需求,對于其中一些企業(yè)來(lái)說(shuō),在每座建筑物中使用的計算機服務(wù)器數量現在甚至已經(jīng)超過(guò)了 10 萬(wàn)臺。在房地產(chǎn)及電能的供應充足而成本較低的地區,這類(lèi)超大規模數據中心的提供商將附近到處蔓生的數據中心的處理能力合并起來(lái),從而充分利用起規模經(jīng)濟。根據思科的預計,截至 2020 年,全部數據中心中近一半裝機的服務(wù)器都將位于超大規模數據中心之內。這些服務(wù)器將占到 68% 的處理能力,以及超過(guò)一半(53%)的數據中心總流量。
隨著(zhù)云端需要為越來(lái)越多的關(guān)鍵任務(wù)型的商業(yè)應用及高時(shí)效性的消費者應用提供支持,在全球范圍內,數據中心的部署愈發(fā)要靠近人口中心。網(wǎng)絡(luò )公司建設的數據中心越來(lái)越多的采用多座建筑物,這些建筑物緊緊相鄰,通過(guò)極大的帶寬相互連接到一起。在人口較為稠密的地區,跨越各個(gè)相互獨立的電網(wǎng)來(lái)建立起數據中心,可以進(jìn)一步地減少延遲、改善消費者的體驗。對于依靠一個(gè)單一電網(wǎng)的更大規模的數據中心來(lái)說(shuō),這一戰略還可以降低風(fēng)險、克服局限。
在每一座超大規模數據中心建筑物的內部,都可能有數萬(wàn)臺以至數十萬(wàn)臺的計算機服務(wù)器,通過(guò)不同層次的以太網(wǎng)交換機相互連接到一起,形成一種集體性的計算能力,致力于網(wǎng)絡(luò )公司自身的服務(wù)(例如,谷歌或臉書(shū)),或者出租給企業(yè)客戶(hù)(例如,亞馬遜的 AWS 或微軟的 Azur)。盡管可以通過(guò)很多種方案來(lái)實(shí)現計算器服務(wù)器的互連,在 2018 年,典型超大規模數據中心網(wǎng)絡(luò )連接的特點(diǎn)在于采用了 DAC(直連銅纜),在 25 或 2x25 Gbps 的速度下,在數米的距離內將服務(wù)器連接到架頂 (ToR)服務(wù)器,然后再采用大量的 100 Gbps 光學(xué)鏈路,通過(guò)規模龐大的交換結構(通常稱(chēng)為葉脊架構)實(shí)現 ToR 交換機的互連。根據這類(lèi)數據中心的具體數量,典型的光學(xué)互連覆蓋范圍最大可達到 500 米(DR),但是大型數據中心所需的距離則要長(cháng)達 2 公里(FR)。
當前一代的 100 G 光端機以 4 信道的光發(fā)送機和光接收機為基礎,分別在 25 Gbps 的速度下并行運行,從而達到 100 Gbps 的聚合帶寬。目前共有兩種類(lèi)型的 100 G 光端機:對于希望部署更多的光纖并且降低每臺光端機成本的用戶(hù),適合使用 PSM-4(并行單模-4)型的光端機。對于期望部署較少光纖的用戶(hù),則更加適用 CWDM4(粗放型 WDM-4)型的光端機。這兩種類(lèi)型的 100 G 光端機在當今都已實(shí)現大批量的部署。
100G/400G 的過(guò)渡及 100G PAM-4 技術(shù)即將到來(lái)
當前超大規模數據中心的特點(diǎn)在于互連速度過(guò)渡的速度更快,往往每三年發(fā)生一次迭代。極具創(chuàng )新性的100 G互連系統正在成為主流,在過(guò)去兩年間已經(jīng)得到廣泛部署,而下一次的速度過(guò)渡也正在逼近。盡管當前正在考慮200 Gbps的速度,而業(yè)界的一致觀(guān)點(diǎn)則是400 Gbps將成為下一步自然而然的選擇。
當前基于4x25 G的100G技術(shù)的封裝過(guò)程過(guò)于復雜,并且無(wú)法擴展到 400 G。為了降低 100 G 的成本,并且通過(guò)經(jīng)濟的方式來(lái)支持400 G的光學(xué)元件,業(yè)界正在轉向采用一項新的技術(shù),采用在50 GBaud下使用PAM-4(4級脈沖幅度調制)編碼的光學(xué)元件,從而實(shí)現每信道 100G 的速度,然后再通過(guò)4x100 G的聚合來(lái)達到400 G的速度。制定100 G Lambda MSA(多源協(xié)議)的目的是定義這一新的行業(yè)標準,并已獲得了23家企業(yè)的推廣支持,而這就代表了一個(gè)廣泛的行業(yè)生態(tài)系統,其中包含了生產(chǎn)半導體集成電路、光端機模塊、網(wǎng)絡(luò )系統的企業(yè),以及作為最終用戶(hù)的網(wǎng)絡(luò )公司。
采用單信道100 G光學(xué)元件的巨大優(yōu)勢包括顯著(zhù)減少了光學(xué)元件的數量從而降低成本,為經(jīng)濟型的400 G速度構建起了堅實(shí)的基礎,并且,當電氣接口在未來(lái)遷移到100 G的串行接口時(shí),無(wú)需再逆向操作。據估計,PAM-4 100 G 在元件數量上可減少 60%,而功率要求則可降低 33%。
100 G Lambda MSA 最近還公布了一份規范的初稿,其中定義了100 G FR(2 公里)、100 G LR(10 公里)及400 G FR4(2 公里),并且還潛在地定義了400 G LR4(10 公里)。隨著(zhù)數字信號處理以及高速硅光子學(xué)之類(lèi)高速光電子設備技術(shù)的進(jìn)步,我們預計業(yè)界將會(huì )很快采納并實(shí)施此類(lèi)技術(shù),現場(chǎng)的部署最早可能從 2019 年開(kāi)始。
數據中心間 (DCI) 解決方案
在世界各地,超大規模數據中心都靠近人口中心部署,并且通過(guò)超高的帶寬互連起來(lái)。盡管各大洲各大洋之間部署了許多的超高速光纖鏈路,其中的大部分鏈路都連接在數據中心園區內的各個(gè)數據中心大樓之間,或者連接在同一都市區的各個(gè)數據中心之間。這些數據中心建筑通過(guò)極高的帶寬相互連接在一起,每秒的速度可達到數十兆位的級別。
對于幾公里范圍內互連到一起的數據中心,運營(yíng)商可以選擇部署簡(jiǎn)單的100 G CWDM4(2 公里)或100 G LR4(10 公里)型的光端機,然后再通過(guò)數百對的光纖來(lái)遷移到100 G FR/LR(使用PAM-4技術(shù))。如果光纖數量不足,并且添加更多的光纖成本過(guò)于高昂,那么運營(yíng)商就可能選擇部署 DWDM(密集波分復用)光端機解決方案,從而達到每對光纖40x100 G的聚合帶寬。對于這類(lèi)園區內的短距離互連來(lái)說(shuō),與復雜性更高的相干傳輸技術(shù)相比,采用直接檢測的單信道100 G PAM-4要經(jīng)濟得多,是一種更具吸引力的解決方案,需要具有偏振復用/多路分解功能的振幅與相位調制/解碼功能,以及配有精密控制光學(xué)本機振蕩器的相干檢測功能。
對于 80 公里距離內的互連數據中心,采用了先進(jìn)數字信號處理技術(shù)的100 G PAM-4 DWDM 在成本上仍然具有優(yōu)勢,由于在全部 DWDM 信道上可以共享補償,因此在可調諧色散補償要求提高的情況下優(yōu)勢依然明顯。將會(huì )采用相干檢測來(lái)覆蓋超出 80 公里的傳輸距離。在數據中心過(guò)渡到400 G后,DCI 解決方案將相應的擴展,而4x100 G PAM-4 則仍可用于傳輸距離相對較短的DCI應用,相干的400 G則將為其他的數據中心間連接拓展覆蓋范圍。
光端機形狀系數
對于100 G的數據中心應用來(lái)說(shuō),業(yè)界采用了QSFP28(四分之一小形狀系數可插拔)收發(fā)模塊。由于業(yè)界正在為從100 G過(guò)渡到400 G進(jìn)行準備,多種新興的 MSA 形狀系數都在參與競爭,希望爭得一席之地。其中一個(gè)領(lǐng)先的選項就是QSFP-DD(四分之一小形狀系數可插拔雙密度),這一選項衍生自QSFP28,數據的電氣連接性能高出2倍,而機械長(cháng)度稍長(cháng)一些,保留了與QSFP28的兼容性。QSFP-DD收發(fā)模塊與線(xiàn)纜籠改進(jìn)了熱設計,支持12瓦以上的功率耗散。
另一個(gè)競爭對手是OSFP(八進(jìn)制小形狀系數可插拔)光端機,與QSFP-DD接口相比,這一光端機的尺寸稍大一些也稍長(cháng)一些。OSFP模塊的主要優(yōu)勢在于形狀系數較大,這樣可實(shí)現更高的功率耗散,達到16瓦。不利之處則是缺少與 QSFP28 的向下的兼容性,而且尺寸稍大,降低了面板信息點(diǎn)的密度。
第三種MSA稱(chēng)為COBO(板載光學(xué)元件聯(lián)盟),定義了一種脫離開(kāi)系統面板信息點(diǎn)而直接配置在系統印刷電路板上的電氣接口。這種配置的優(yōu)勢在于可以靈活的放置收發(fā)模塊,使其更加接近速度更高的開(kāi)關(guān)集成電路接口,便于處理信號完整性上的問(wèn)題。由于COBO收發(fā)模塊安裝在二維的印刷電路板表面,還可以為散熱器的實(shí)施提供更多的空間,從而潛在的為提高功率耗散的額定值而提供支持。
對于以快速的步伐進(jìn)行大力投入、從而跟上技術(shù)發(fā)展與服務(wù)創(chuàng )新的潮流的主要的網(wǎng)絡(luò )公司來(lái)說(shuō),超大規模數據中心正在迅速的成為一種關(guān)鍵的基礎設施。在世界各地的超大規模數據中心內,對速度更快的電氣與光學(xué)信號技術(shù)的開(kāi)發(fā)工作將繼續加速大規模的數據聚合。100 G和400 G光學(xué)技術(shù)的最新發(fā)展可以促成廣泛而又高效的超大規模數據中心連接解決方案,為內容日益豐富的數據密集型應用提供大力支持。
本文來(lái)源于《電子產(chǎn)品世界》2018年第8期第27頁(yè),歡迎您寫(xiě)論文時(shí)引用,并注明出處。
評論