全球最快人工智能訓練服務(wù)器浪潮NF5488A5在智博會(huì )重磅發(fā)布
8月15日,在蘇州舉行的2020全球人工智能產(chǎn)品應用博覽會(huì )(AIExpo2020)上,浪潮重磅發(fā)布人工智能服務(wù)器NF5488A5。在前不久公布的全球權威AI測試榜單MLPerf中,浪潮NF5488A5僅用時(shí)33.37分鐘,就在包含128萬(wàn)張圖片的ImageNet數據集上完成Resnet50模型的訓練,相當于每秒訓練23000多張圖片,單機計算性能高居第一,可謂最快人工智能訓練服務(wù)器。
浪潮重磅發(fā)布人工智能服務(wù)器NF5488A5
MLPerf是國際權威的AI測試,2018年由圖靈獎得主Patterson聯(lián)合谷歌、哈佛、斯坦福等發(fā)起,每年發(fā)布訓練和推理兩次基準測試榜單。今年的MLPerf訓練測試包含8個(gè)主流人工智能模型,涉及計算機視覺(jué)、自然語(yǔ)言理解、推薦模型和強化學(xué)習4個(gè)領(lǐng)域。浪潮NF5488A5人工智能服務(wù)器除了在Resenet50中取得榜首外,還在人工智能自然語(yǔ)言理解Transformer、神經(jīng)網(wǎng)絡(luò )翻譯系統GNMT、深度學(xué)習推薦模型DLRM、目標監測算法SSD等MLPerf的模型訓練評估中均取得不俗成績(jì)。
NF5488A5是浪潮自研的新一代AI服務(wù)器,單機訓練性能可達5 PetaOPS,相比上一代服務(wù)器計算性能提升234%。兩年前Facebook的科學(xué)家用32臺GPU服務(wù)器、256塊GPU花了1個(gè)小時(shí)完成了ImageNet上的Resnet50訓練,而現在僅需一臺NF5488A5,即可在33分鐘完成同樣的訓練,單臺設備訓練效率提升近60倍。同時(shí),浪潮優(yōu)化了NF5488A5的拓撲結構,采用NUMA綁定策略,可實(shí)現CPU與最近GPU的指定通信,大幅提升CPU與GPU之間的數據傳輸效率,實(shí)現更低的數據傳輸延遲和更高的帶寬,滿(mǎn)足各種AI負載高效數據通信需求。此外,NF5488A5在能效和散熱方面也充分考慮了用戶(hù)需求:4U尺寸設計,適用于更廣泛的數據中心部署環(huán)境;優(yōu)化的供電策略可提高供電穩定性并降低TCO;先進(jìn)的散熱系統實(shí)時(shí)保證散熱穩定可靠,完美滿(mǎn)足35攝氏度環(huán)境溫度下工作。
NF5488A5可廣泛應用于圖像視頻、語(yǔ)音識別、金融分析、智能客服等典型AI應用場(chǎng)景,幫助AI用戶(hù)高效完成AI基礎設施和開(kāi)發(fā)環(huán)境的構建,縮短開(kāi)發(fā)周期,顯著(zhù)提升AI開(kāi)發(fā)和應用效率,在享受更高計算性能的同時(shí)降低部署、運行成本。
浪潮是人工智能計算的領(lǐng)導品牌,AI服務(wù)器中國市場(chǎng)份額保持50%以上。并與人工智能領(lǐng)先科技公司保持在系統與應用方面的深入緊密合作,幫助AI客戶(hù)在語(yǔ)音、語(yǔ)義、圖像、視頻、搜索、網(wǎng)絡(luò )等方面取得數量級的應用性能提升。
評論