<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 網(wǎng)絡(luò )與存儲 > 新品快遞 > 美光 DDR5 內存配合第四代 AMD EPYC 處理器,提升高性能計算工作負載

美光 DDR5 內存配合第四代 AMD EPYC 處理器,提升高性能計算工作負載

作者:Krishna Yalamanchi、Sudharshan Vazhkudai (美光) 時(shí)間:2022-12-19 來(lái)源:電子產(chǎn)品世界 收藏

AMD聯(lián)手為客戶(hù)及數據中心平臺提供一流的用戶(hù)體驗。雙方在奧斯汀建立聯(lián)合服務(wù)器實(shí)驗室,以減少服務(wù)器內存驗證時(shí)間,在產(chǎn)品驗證和發(fā)布期間共同進(jìn)行工作負載測試。目前適用于數據中心的 內存和第四代 TMTM (霄龍)處理器均已出貨,我們對其進(jìn)行了一些常見(jiàn)的高性能計算(HPC)工作負載基準測試。

本文引用地址:http://dyxdggzs.com/article/202212/441765.htm


長(cháng)期以來(lái),超級計算機承擔著(zhù)高性能計算工作負載。此類(lèi)大規模的數據密集型工作負載需要運行TB 級的數據量以進(jìn)行數百萬(wàn)個(gè)并行操作,以解決人類(lèi)世界的難題,如天氣和氣候預測;地震建模;化學(xué)、物理和生物分析等。

隨著(zhù)計算機架構的進(jìn)步,此類(lèi)工作負載往往托管在超大型“可橫向擴展”的高性能服務(wù)器集群中。這些服務(wù)器集群需要集合最強大的算力、架構、內存和存儲基礎設施,以滿(mǎn)足關(guān)鍵工作負載對可擴展性、低延遲和高性能的需求。然而隨著(zhù)服務(wù)器 CPU 的性能和吞吐量不斷增長(cháng),DDR4 無(wú)法提供足夠的內存帶寬,來(lái)滿(mǎn)足不斷增長(cháng)的高性能內核。

 

image.png

  

為緩解這一瓶頸, 內存與采用了Zen 4 服務(wù)器架構的第四代 處理器強強聯(lián)合,使服務(wù)器 CPU 能夠更好地匹配內存產(chǎn)品,滿(mǎn)足數據密集型工作負載對性能和效率的需求。美光 內存可幫助企業(yè)從本地和云端數據中更快獲取洞察。我們對最新的 AMD Zen 4 96 CPU和美光DDR5進(jìn)行了行業(yè)內高性能計算工作負載基準測試,所有結果均顯示性能提升了兩倍。


美光 DDR5 搭配第四代 處理器,在STREAM 測試中實(shí)現內存帶寬翻倍

STREAM1
是常見(jiàn)的基準測試工具,用于測量高性能計算機的內存帶寬,可捕獲高性能計算系統的峰值內存帶寬。

該工作負載使用的軟件堆棧

 

·       Alma 9 Linux kernel 5.14

·       STREAM.f,2021 11 29 日發(fā)布版本

image.png

測試設置

·       DDR4 系統搭配第三代 64 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2 RDIMM 內存槽插滿(mǎn),共 64GB

·       DDR5 系統搭配第四代 96 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3 RDIMM 內存槽插滿(mǎn),共 64GB

測試結果

·       DDR5 系統每插槽內存帶寬翻倍,達到 378 GB/s

·       該結果意味著(zhù)客戶(hù)能運行更大規模的人工智能/機器學(xué)習 AI/ML)項目,或利用 DDR5 增加的內存帶寬進(jìn)行更多高性能計算。

 

image.png

 

美光 DDR5, 助力天氣研究和預報 WRF4 速度提升2

此次測試使用的高性能計算工作負載代碼針對天氣和氣候。WRF模型在一些支持高性能浮點(diǎn)處理、高內存帶寬、低延遲網(wǎng)絡(luò )等傳統高性能計算架構中表現良好,測試對象為橫向分辨率為 2.5 公里的美國大陸地區 CONUS)。

該工作負載使用的軟件堆棧

·       Alma 9 Linux kernel 5.14?

·       WRF 2.3.5 & 4.3.3?

·       Open MPI v4.1.1

測試設置

·       DDR4 系統搭配第三代64 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2 RDIMM 內存槽插滿(mǎn),共 64GB

·       DDR5 系統搭配第四代 96 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3 RDIMM 內存槽插滿(mǎn),共 64GB

測試結果

·       美光 DDR5 搭配第四代 AMD EPYC 處理器,可實(shí)現 1.3567 時(shí)間步/ VS DDR4 系統的2.8533 時(shí)間步/

·       速度更快意味著(zhù)可使用更大的數據庫或運行更多模型以進(jìn)行天氣預測,進(jìn)而改善預測的準確度。

美光 DDR5,助力OpenFOAM5 速度提升2

OpenFOAM
是一種計算流體動(dòng)力學(xué)(CFD)的開(kāi)源高性能計算工作負載,廣泛應用于多個(gè)行業(yè),有助于縮短開(kāi)發(fā)時(shí)間并降低成本。從消費類(lèi)產(chǎn)品設計到航空航天設計,OpenFOAM能夠模擬不同應用中的物理互動(dòng),包括摩托車(chē)風(fēng)擋湍流。在該模擬中,OpenFOAM 能夠計算摩托車(chē)和騎手周?chē)姆€定氣流。OpenFOAM 能夠根據用戶(hù)指定的進(jìn)程數進(jìn)行負載均衡計算,以此將網(wǎng)格分解成多個(gè)部分并分配給不同的進(jìn)程求解。求解完成后,再將網(wǎng)格和解重新組合為單個(gè)域。


該工作負載使用的軟件堆棧

·       OpenFOAM CFD 軟件(版本8),其中摩托車(chē)網(wǎng)格尺寸為:600 x 240 x 240

·       Alma 9 Linux kernel 5.14?

·       Open MPI v4.1.1

測試設置

·       DDR4 系統搭配第三代64 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2 RDIMM 內存槽插滿(mǎn),共 64GB

·       DDR5 系統搭配第四代 96 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3 RDIMM 內存槽插滿(mǎn),共 64GB

測試結果


測試結果表明美光DDR5 產(chǎn)品組合將OpenFOAM 性能提高了 2.4 倍。OpenFOAM 為五大高性能計算軟件平臺之一,擁有大型開(kāi)源社區。該軟件廣泛應用于大學(xué)和研發(fā)中心,可利用高帶寬內存和擁有密集內核的高性能CPU,實(shí)現高度的并行操作。

美光 DDR5 ,助力分子動(dòng)力學(xué)6 速度提升2

CP2K
是一款開(kāi)源量子化學(xué)工具,適用于許多應用,包括固態(tài)生物系統模擬。CP2K 能夠為不同的建模方法提供通用的框架。此次測試對象為水(H2O)的密度泛函理論(DFT),模擬盒子中共包含 6,144 個(gè)原子(2,048 個(gè)水分子)。

該工作負載使用的軟件堆棧

·       H2O-DFT-LS.NREP4 H2O-DFT-LS

·       Alma 9 Linux kernel 5.14

測試設置

·       DDR4 系統搭配第三代64 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2 RDIMM 內存槽插滿(mǎn),共 64GB

·       DDR5 系統搭配第四代 96 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3 RDIMM 內存槽插滿(mǎn),共 64GB

測試結果
測試結果表明美光DDR5 產(chǎn)品組合將分子動(dòng)力學(xué)性能提高了2.1 倍。隨著(zhù)內核數和內存帶寬增加,此類(lèi)工作負載的性能也顯著(zhù)提升。

總結

目前我們只針對少量高性能計算工作負載進(jìn)行了測試,因此以上只是我們的初步成果。將高性能高帶寬內存與最新的服務(wù)器處理器(如第四代 AMD EPYC 處理器)相結合,可為高性能計算客戶(hù)創(chuàng )造新的可能。我們期待更多企業(yè)數據中心和云服務(wù)商,能夠在新平臺上應用美光 DDR5 產(chǎn)品,解鎖更高的性能與能效。 

________________________

我們在 STREAM 基準測試中配置了 25 億個(gè)向量的STREAM Benchmark——運行在一臺單 AMD CPU 系統上
2 AMD DDR4
系統為一臺 64 AMD EPYC 7763 處理器, DDR4-3200 MHz RDIMM 內存槽插滿(mǎn),共 64GB
3 AMD DDR5
系統為一臺 96 AMD EPYC 9654 處理器, DDR5-4800 MHz RDIMM 內存槽插滿(mǎn),共 64GB
橫向分辨率為 12.5 公里CONUS WRF DDR4 系統上的運行時(shí)間為 929 秒,在 DDR5 系統上的運行時(shí)間為 287 秒(均包括存儲器的輸入/輸出時(shí)間)。該測試中 WRF 配置為 2.5 公里 CONUS,測試結果為 1.3567 時(shí)間步/ 秒, 相比之下DDR4 的運行時(shí)間為2.8533時(shí)間步/秒。
5 
針對 OpenFOAM,我們運行了三種變體:
5a
1004040 runtimes,DDR4 系統運行時(shí)間為 1,144 秒,DDR5 系統運行時(shí)間為 478
5b
1084646 runtimes,DDR4 系統運行時(shí)間為 1,633 秒,DDR5 系統運行時(shí)間為 698
5c
1305252 runtimes,DDR4 系統運行時(shí)間為 2,522秒,DDR5 系統運行時(shí)間為 1,091
6
分子動(dòng)力學(xué)工作負載在 DDR4 系統上的運行時(shí)間為 2,519 秒,在 DDR5 系統上的運行時(shí)間為 1,242


作者

 image.pngKrishna Yalamanchi

Krishna 擔任美光生態(tài)系統高級開(kāi)發(fā)經(jīng)理,專(zhuān)注于研發(fā) DDR5 CXL 解決方案。他曾在英特爾 IT 部門(mén)任職,領(lǐng)導 SAP HANA 的遷移工作,通過(guò)與SI、OEM和云服務(wù)提供商共同搭建的合作伙伴生態(tài)系統,推出了用于SAP工作負載的第三代與第四代 Intel Xeon 處理器。

 

image.pngSudharshan Vazhkudai

Sudharshan S. Vazhkudai 博士擔任美光系統架構和工作負載分析總監。他領(lǐng)導一支位于奧斯汀和印度海得拉巴的團隊,致力于研究?jì)却婧痛鎯Γ?/span>DDR、CXL、HBM NVME)產(chǎn)品中層次結構的可組合性,并優(yōu)化與數據中心工作負載相關(guān)的系統架構。



關(guān)鍵詞: 美光 DDR5 AMD EPYC

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>