Marvell ThunderX3處理器解析:96核心384線(xiàn)程、ARM芯片之王
長(cháng)久以來(lái),服務(wù)器、數據中心領(lǐng)域一直是x86 CPU架構的天下,但是隨著(zhù)市場(chǎng)需求、應用負載的多元化,隨著(zhù)云計算、邊緣計算、高性能計算的不斷演進(jìn),RISC-V、ARM等架構也都迎來(lái)了新的爆發(fā)機遇,尤其是ARM,眾多巨頭紛紛參與,生態(tài)建設也是如火如荼。
本文引用地址:http://dyxdggzs.com/article/202004/412408.htm比如最近,亞馬遜就發(fā)布了ARM架構的64核心Graviton2,安晟培(Ampere)則推出了80核心的Altra?,F在,Mavell(美滿(mǎn)電子)奉上了第三代ARM芯片“ThunderX3”。
Marvell的大名很多人可能不太熟悉,但這家歷史悠久的半導體企業(yè)其實(shí)隨時(shí)都在你身邊,比如機械硬盤(pán)主控,絕大部分都出自Marvell的手筆,SSD主控也有豐富的產(chǎn)品。
Marvell成立于1995年,總部位于美國加州圣克拉拉,在美國、以色列、印度、德國、中國都設有研發(fā)中心,全球員工超過(guò)5000人,全球專(zhuān)利超過(guò)1萬(wàn)件,2020財年收入27億美元,核心業(yè)務(wù)覆蓋存儲、網(wǎng)絡(luò )、計算三大領(lǐng)域,特別是擁有超過(guò)15年的高性能多核心CPU研發(fā)經(jīng)驗。
Mavell旗下?lián)碛型暾腃PU處理器產(chǎn)品線(xiàn),包括Armada、Octeon TX、Octeon Fusion、ThunderX四大系列,尤其是已經(jīng)悄然成為全球最大的ARM服務(wù)器處理器供應商,應用范圍、生態(tài)支持都獨步全球,累計出貨量已突破1億顆。
2017年,Marvell還以約60億美元的價(jià)格收購了美國無(wú)工廠(chǎng)半導體企業(yè)Cavium(凱為半導體),進(jìn)一步增強了ARM平臺的設計能力。
既然有了成熟的x86,為何要大力推廣ARM?它有什么吸引整個(gè)行業(yè)的呢?
Marvell認為,在架構、工藝、性能、能效、生態(tài)等多個(gè)方面,ARM都展現出了更優(yōu)秀的品質(zhì),雖然不會(huì )也不能全方位取代x86,但是在部分特定領(lǐng)域,尤其是云計算、高性能計算等,已經(jīng)明顯超越x86。
架構方面,x86一直是一個(gè)架構打天下,從服務(wù)器數據中心到桌面筆記本消費級,都基于同一個(gè)架構衍生不同的產(chǎn)品,缺乏靈活性,尤其是在并行處理方面,而且規模越做越大,也導致成本、功耗越來(lái)越無(wú)法滿(mǎn)足需求。
工藝方面,Intel已經(jīng)失去了領(lǐng)導地位,至強系列至今還是14nm,AMD雖然走到了7nm,但又在架構上“取巧”使用chiplet多芯片設計,導致內存帶寬、內存延遲明顯不足,ARM方面則跟著(zhù)臺積電一路走到了7nm,并即將進(jìn)入5nm。
性能和能效方面,Marvell認為ARM架構的單線(xiàn)程性能已經(jīng)是一流水準,多線(xiàn)程和平臺性能更是遙遙領(lǐng)先,內存帶寬、延遲同樣優(yōu)秀,而且功耗低、能效高。
生態(tài)方面,x86雖然歷史悠久,但負擔也很重,比如考慮各種歷史甚至是消費級兼容性,ARM則沒(méi)有過(guò)多拖累,架構直接為服務(wù)器優(yōu)化而生。
同時(shí),軟硬件行業(yè)對ARM的支持也越來(lái)越豐富,比如Marvell ThunderX2已經(jīng)被20多家終端客戶(hù)部署在大規模云計算、高性能計算市場(chǎng),包括微軟Azure、HPE、Cray、Atos、洛斯阿拉莫斯國家實(shí)驗室、桑迪亞國家實(shí)驗室、勞倫斯利弗莫爾國家實(shí)驗室、橡樹(shù)嶺國家實(shí)驗室、布里斯托大學(xué)、萊徹斯特大學(xué)等等。
甚至,Intel的一些軟硬件技術(shù)同樣支持ARM平臺,NVIDIA、AMD GPU同樣也支持。
接下來(lái)說(shuō)說(shuō)具體產(chǎn)品。Marvell ThunderX系列嚴格遵循每?jì)赡晟壱淮穆肪€(xiàn)圖,ThunerX2系列誕生于2018年,而在今天的主角ThunerX3之后,2022年還將看到ThunerX4,工藝也是一路升級,28nm、16nm、7nm……
ThunerX3采用臺積電7nm DUV工藝制造,基于Marvell自主研發(fā)架構,指令集兼容ARM v8.3 ,最多96個(gè)核心,而且繼續支持4線(xiàn)程,也就是最多384個(gè)線(xiàn)程,是上一代的整整三倍,而且支持雙路并行,此時(shí)單系統可提供192個(gè)核心、768個(gè)線(xiàn)程。
同時(shí),頻率方面基準最高2.4GHz,最高加速3.1GHz,比上代還提高了100MHz。
新的內核集成四個(gè)128-bit Neon SIMD單元,就寬度而言等效于一個(gè)x86 AVX-512,從而大大提高了浮點(diǎn)性能。Intel至強最高端型號兩個(gè),AMD霄龍則是每核心兩個(gè)256-bit SIMD單元,基本等效。
內存支持八通道DDR4,頻率達3200MHz,并支持64條PCIe 4.0(16個(gè)控制器),比上代PCIe 3.0更進(jìn)一步而且增加了8條通道,未來(lái)還會(huì )隨著(zhù)PCIe 5.0/6.0標準的演進(jìn)而升級。
當然了,企業(yè)級的RAS、虛擬化這些都是必不可少的元素。
接下來(lái)說(shuō)說(shuō)性能,當然都是來(lái)自Marvell官方的數據,而且具體性能表現取決于特定的工作負載。
綜合性能方面,ThunderX3對比上代IPC(每時(shí)鐘周期指令數)性能提升超過(guò)25%,基本可視為架構本身的進(jìn)步幅度,而結合更高的運行頻率,單核心性能提升超過(guò)60%,再加上大大增加的核心數,整體性能提升可以超過(guò)3倍!
對比x86雙雄,ThunderX3的優(yōu)勢不在于絕對性能,而是更好的能效,相比于A(yíng)MD Rome二代霄龍可高出30%,對比Intel二代可擴展至強更是領(lǐng)先多達1.2倍。
ThunderX3并不貪大求全,主攻市場(chǎng)只有兩個(gè),一是云計算,包括大數據、數據庫、流媒體、Web、搜索、存儲、移動(dòng)應用開(kāi)發(fā)、手游等等,其高度并行、豐富I/O、超低延遲、ARM原生都是獨特優(yōu)勢。
性能方面,單核心四線(xiàn)程可以帶來(lái)可觀(guān)的性能提升,常見(jiàn)應用中最多可以提升達80%,特定負載下甚至能見(jiàn)到3-4倍的提升。
對比AMD二代霄龍、Intel二代可擴展至強,ThunderX3在云端也毫不示弱,所服務(wù)的領(lǐng)域內已經(jīng)全面勝出,而且延遲更低,而且支持更多數量的虛擬機。
第二個(gè)主攻方向就是高性能計算,包括政府部門(mén)、天氣預報、油氣勘探、計算機輔助工程、生物基因、電子設計自動(dòng)化等,高內存帶寬、高能效、高并行性的特點(diǎn)可以說(shuō)非常適合。
對比兩家x86方案, ThunderX3在浮點(diǎn)、內存帶寬指標以及量子化學(xué)、計算流體動(dòng)力學(xué)、計算化學(xué)、矢量物理等應用方面,都有著(zhù)不俗的表現。
對于ThunderX3的市場(chǎng)前景,Marvell也是非常積極樂(lè )觀(guān),透露現在部署ThunderX2的超過(guò)20家客戶(hù),都在準備升級ThunderX3,而后續的ThunderX4還會(huì )繼續帶來(lái)大幅度的提升。
中間的是上代ThunderX2
評論