賽靈思發(fā)布史上最強ACAP芯片:7nm、還有PCIe 5.0
2018年10月16日,FPGA大廠(chǎng)賽靈思(Xilinx)在北京的“Xilinx開(kāi)發(fā)者大會(huì ) ”(XDF)上,發(fā)布了全球首款自適應計算加速平臺(ACAP)芯片系列Versal,并發(fā)布了AI Core系列和Prime系列。去年,這兩個(gè)系列產(chǎn)品也已經(jīng)成功推向了市場(chǎng)。
本文引用地址:http://dyxdggzs.com/article/202003/410849.htm今天(3月11日),賽靈思舉行線(xiàn)上發(fā)布會(huì ),正式推出了Versal ACAP產(chǎn)品組合的第三大產(chǎn)品系列—— Versal Premium。
賽靈思認為,隨著(zhù)來(lái)自多元化應用和工作負載(比如智能設備、視頻流、物聯(lián)網(wǎng)、企業(yè)等)的數據爆炸性增長(cháng),這也使得核心網(wǎng)正面臨巨大的壓力。
數據顯示,2019年區域流量容量提升了100倍,帶寬年復合增長(cháng)率達到了51%。
隨著(zhù)數據的爆炸性增長(cháng),對于整個(gè)網(wǎng)絡(luò )基礎設施提出了更高的要求,這也加速驅動(dòng)了網(wǎng)絡(luò )轉型。而在這個(gè)轉型過(guò)程當中,我們可以看到三個(gè)趨勢:
1、下一代核心網(wǎng)絡(luò )加速擴展。
根據ABI Research數據顯示,2020年-2024年5G核心網(wǎng)年復合增長(cháng)率預計為313%。
2、安全已成為網(wǎng)絡(luò )運營(yíng)商最高優(yōu)先級的問(wèn)題。
ISH Markit的研究顯示,對于網(wǎng)絡(luò )運營(yíng)商來(lái)說(shuō),過(guò)去性能、擴展性、成本一直是運營(yíng)商主要關(guān)注的問(wèn)題,而現在,安全性已經(jīng)成為了網(wǎng)絡(luò )運營(yíng)商最為關(guān)注的問(wèn)題。
3、隨著(zhù)數據的增長(cháng),對于計算能力與帶寬的需求越來(lái)越高。
我們可以看到,現在網(wǎng)絡(luò )的帶寬的增長(cháng)非常的迅速,但是,隨著(zhù)摩爾定律的放緩甚至是趨于消亡,芯片的計算能力越來(lái)越跟不上了。根據賽靈思的估算,2018年之時(shí),服務(wù)器端口速度的增長(cháng)已經(jīng)超過(guò)了摩爾定律對于服務(wù)器CPU性能所帶來(lái)的增長(cháng),并且差距正在進(jìn)一步擴大。
在此背景之下,為了加速運營(yíng)商的網(wǎng)絡(luò )轉型,賽靈思推出了Versal Premium ACAP系列產(chǎn)品,其具備了高度集成且功耗優(yōu)化的網(wǎng)絡(luò )硬核,是業(yè)界帶寬最高、計算密度最高的自適應平臺。專(zhuān)為在散熱條件和空間受限的環(huán)境下運行最高帶寬網(wǎng)絡(luò ),以及需要可擴展、靈活應變應用加速的云提供商而設計。
Versal Premium ACAP系列詳解
我們都知道,2018年賽靈思推出的Versal系列是業(yè)界首款自適應計算加速平臺( ACAP ),是一個(gè)功能遠超常規芯片架構的革命性全新異構計算器件類(lèi)別。而據賽靈思介紹,其去年就已經(jīng)向客戶(hù)交付的Versal AI Core系列和Versal Prime系列,已經(jīng)獲得了幾百家客戶(hù)的采用,反響很好,目前正在加速生產(chǎn)。
而此次賽靈思推出的全新Versal Premium則是Versal Prime系列的升級款版,是針對網(wǎng)絡(luò )基礎設施推出的旗艦級產(chǎn)品,采用臺積電7nm工藝制程打造而成,融軟件可編程能力與動(dòng)態(tài)可配置硬件加速、預制連接和安全功能為一體,為加快產(chǎn)品上市進(jìn)程提供了強大引擎。
作為 Versal ACAP 的最新產(chǎn)品系列, Versal Premium 系列可提供比當前FPGA高達三倍的吞吐量,且擁有高度集成的軟件/硬件平臺,內置了以太網(wǎng)接口、Interlaken和加密引擎,以打造快速、安全的網(wǎng)絡(luò )。該系列還提供了當前部署主流 FPGA 兩倍的計算密度,同時(shí)還面向持續擴展的多元化且不斷演進(jìn)的云工作負載及網(wǎng)絡(luò )工作負載,提供了靈活應變的能力。
Versal Prime系列
具體來(lái)說(shuō),與之前的Versal Prime系列相比,Versal Premium系列在其原有的靈活多變的平臺(集成了Arm應用處理器內核和實(shí)時(shí)處理器內核、自適應硬件、DSP引擎、高速片上可編程網(wǎng)絡(luò )等等)上,突破性地集成了功耗優(yōu)化的網(wǎng)絡(luò )硬核(ASIC),包括:400G高速加密引擎、600G Interlaken硬核、600G以太網(wǎng)硬核、112G PAM4收發(fā)器、帶有DMA的PCIe 5.0、CCIX。
Versal Premium系列
據賽靈思介紹,Versal Premium系列所提供的網(wǎng)絡(luò )IP集成,提供了等效22個(gè)16nm FPGA的邏輯密度,極大縮減了開(kāi)發(fā)者在設計基礎架構與連接上的投入,可以使得開(kāi)發(fā)者將更多的精力專(zhuān)注于差異化。
同時(shí),這也使得Versal Premium系列能夠超越摩爾定律的局限,實(shí)現新一代的帶寬與處理能力,并且能夠顯著(zhù)降低資本支出與運營(yíng)成本。
前面提到,Versal Premium系列所集成的一系列功耗優(yōu)化的網(wǎng)絡(luò )硬核,提供了等效22個(gè)16nm FPGA的邏輯密度,這也意味著(zhù)Versal Premium系列可以釋放更多的邏輯用于個(gè)性化定制。
根據賽靈思公布的資料顯示,其Virtex UltraScale+ VU9P內部的20萬(wàn)個(gè)LUT被用于了控制器、存儲器、PCIe接口等基礎設施(包括4個(gè)存儲器、4個(gè)控制器和一個(gè)PCIe+DMA),而相比之下,Versal Premium系列直接將這些作成了網(wǎng)絡(luò )硬核,使得其基礎設施對于內部的LUT的消耗為0??梢詭椭蛻?hù)降低異構成本,更好的專(zhuān)注于差異化。
另外,在易用性方面,賽靈思面向各種類(lèi)型的開(kāi)發(fā)人員提供了豐富的軟硬件集成平臺,可以讓他們使用自己熟悉的框架和工具來(lái)進(jìn)行開(kāi)發(fā)。
對于數據科學(xué)家來(lái)說(shuō),可以通過(guò)TensorFlow、Caffe、PyTorch等同用框架來(lái)利用Versal Premium系列;軟件開(kāi)發(fā)者也可通過(guò)賽靈思去年推出的Vitis統一開(kāi)發(fā)平臺來(lái)使用Versal Premium系列;而硬件開(kāi)發(fā)者則可以通過(guò)VIVADO平臺來(lái)使用Versal Premium系列。
賽靈思表示,下一代基礎設施需要更大的帶寬密度,且方案受限于現有的外形尺寸、功耗和材料,另外,數據中心的占地面積也是有限的。這就要求,下一代的基礎設施需要功耗優(yōu)化的高吞吐量與計算量。
Versal Premium系列所集成的112G PAM4收發(fā)器、400G高速加密引擎、600G Interlaken硬核、600G以太網(wǎng)硬核、帶有DMA的PCIe Gen5&CCIX等硬核IP,不僅能夠提供功能優(yōu)化的高帶寬密度,提供自適應硬件的靈活應變性,還可適合AI和ML,可以幫助客戶(hù)系統適應不斷變化的算法和安全威脅。
隨著(zhù) 5G 網(wǎng)絡(luò )投入運營(yíng),網(wǎng)絡(luò )流量大幅增長(cháng),導致現有空間和功耗范圍內功耗優(yōu)化吞吐量與計算密度的需求不斷提高。為支持業(yè)界應對這一挑戰,Versal Premium 系列提供了高達 9Tb/s 的可擴展、自適應串行帶寬。具體方法是將 112G PAM4 收發(fā)器與集成的網(wǎng)絡(luò )功能模塊用于核心網(wǎng)、城域網(wǎng)和數據中心互聯(lián)( DCI )基礎設施,將每端口帶寬密度提高兩倍,并降低時(shí)延高達 50%。
另外,在當前400G網(wǎng)絡(luò )的發(fā)展與部署上,58Gb/s的PAM4收發(fā)器就足以應對,而Versal Premium系列所集成的112Gb/s PAM4收發(fā)器則可在向下兼容的基礎上,同時(shí)可面向未來(lái)的單通道100G光通信和800G網(wǎng)絡(luò )基礎設施的發(fā)展需求。并且可兼容更具挑戰性的銅纜線(xiàn)和基板。
Versal Premium系列的通道化以太網(wǎng)硬核能夠以最小占板空間提供高達5Tb/s的可擴展以太網(wǎng)吞吐量,可適用于下一代核心網(wǎng)400G和800G基礎設施,支持多速率、多標準;支持1.8Tb/s現有的Interlaken協(xié)議下的芯片間的互聯(lián)通信;支持1.6TB/s加密線(xiàn)路速率吞吐量(擁有硬化的400G加密引擎),并支持 AES-GCM-256/128、MACsec 和 IPsec 。
Versal Premium系列是全球邏輯密度最高的7nm可編程邏輯平臺,支持硬件差異化、標準演進(jìn)以及AI/ML。為開(kāi)發(fā)者提供了很大的差異化設計且與未來(lái)兼容:如帶內網(wǎng)絡(luò )遙測、vRAN,且適應各種標準與協(xié)議;擁有網(wǎng)絡(luò )異常檢測AI:支持入侵檢測、惡意軟件識別,應對新興威脅的自適應AI算法,賽靈思隨機森林算法IP;配置與網(wǎng)絡(luò )性能AI:自動(dòng)檢測與性能瓶頸糾正,自動(dòng)配置,最大限度延長(cháng)正常運行時(shí)間。
根據賽靈思提供的數據顯示,Versal Premium系列擁有業(yè)界領(lǐng)先的多太比特吞吐量,相比賽靈思Virtex UltraScale+(VU13P)提升了5倍以上。
在能效方面,Versal Premium系列可以低于100瓦的功耗提供單芯片800G DCI(數據中心互聯(lián))吞吐量,與前代的Virtex UltraScale+相比,功耗降低了60%。在數據中心的應用當中,Versal Premium與前代的FPGA相比,可以提供2倍的帶寬密度,這也意味著(zhù),在帶寬相同的情況下,Versal Premium的機柜空間占用只有前代FPGA的一半。
與此同時(shí),Versal Premium系列還支持以嵌入式方式將預制連接與硬核集成到現有云基礎設施中。從基因組學(xué)、數據分析和視頻轉碼,到針對語(yǔ)音和圖像識別的 AI 推斷,Versal Premium 提供了高度集成的云就緒平臺,為多元化的工作負載提供突破性能。
具體到AI性能方面,Versal Premium系列在NeatNet50(224 x 224)圖像分類(lèi)模型下的性能是英偉達Tesla V100的1.6倍,是英偉達Tesla T4的2.3倍;在Yolov2(608×608)對象檢測模型下,性能分別是英偉達V100和T4的4.6倍和7.7倍;在異常檢測AI方面(隨機森林算法),性能是英特爾Xeon的65倍。
另外,存儲器也是計算加速的一個(gè)重要瓶頸。Versal Premium系列不僅擁有1Gb的緊密耦合的存儲器,可以改善性能,降低功耗和延時(shí),同時(shí)內部還集成了LUTRAM、塊RAM、UltraRAM,以及高速片上網(wǎng)絡(luò )、硬化的內存控制器,可以提供高達123TB/s的片上存儲器帶寬,分別是英偉達Tesla V100和T4 GPU的9倍和25倍。而將超過(guò)123TB/s 的片上存儲器帶寬與可定制存儲器層級相結合,能夠減少數據移動(dòng)從而消除相應的關(guān)鍵瓶頸。
賽靈思表示,Versal Premium ACAP解鎖了GPU無(wú)法企及的性能。
產(chǎn)品與供貨
賽靈思Versal Premium系列提供了7款產(chǎn)品,系統邏輯單元從最小160萬(wàn)個(gè)到最高740萬(wàn)個(gè);自適應引擎LUT數量從最低72萬(wàn)個(gè)到最高340萬(wàn)個(gè)。
據介紹,Versal Premium 系列將于 2021 年上半年開(kāi)始為早期用戶(hù)提供樣品。目前已提供文檔,客戶(hù)可立即使用 Versal Prime 評估套件開(kāi)始原型設計。Versal Prime 器件與 Versal Premium 器件擁有眾多相同的架構模塊,支持引腳遷移至 Versal Premium。
評論