剖析NVIDIA是如何開(kāi)啟人工智能之路的
高性能計算系統為人工智能提供高效的計算能力
本文引用地址:http://dyxdggzs.com/article/201701/342729.htm高性能計算卡
2016年9月,NVIDIA發(fā)布新一代高性能計算卡Tesla P40、Tesla P4,它們倆將取代上代麥克斯韋架構的Tesla M40/M4,進(jìn)化到最新的帕斯卡架構,擁有16nm工藝。這兩款計算卡主要負責圖像、文字和語(yǔ)音識別,專(zhuān)為人工智能、深度學(xué)習、神經(jīng)網(wǎng)絡(luò )推演而生。
Tesla P4及P40特別針對推論設計,使用經(jīng)訓練的深度神經(jīng)網(wǎng)絡(luò )識別語(yǔ)音、影像及文字以回應使用者和裝置要求。Pascal架構GPU具備以8位(INT8)運算為主的專(zhuān)門(mén)推論指令,提供比CPU快45倍的反應速度,與不到一年前推出的GPU解決方案相比則提升了4倍。

Tesla P4可為超大規模數據中心提供極高的能效,一臺配備單個(gè)Tesla P4的服務(wù)器可以取代13臺CPU服務(wù)器,總體擁有成本可節省超過(guò)800%。Tesla P40可提供非常高的深度學(xué)習工作負載處理能力,一臺配備八塊Tesla P40加速器的服務(wù)器在性能上可媲美140多臺CPU服務(wù)器,同時(shí)成本節省超過(guò)65萬(wàn)美元。Tesla P40/P4將分別在2016年10月、11月開(kāi)始給相關(guān)OEM、ODM廠(chǎng)商供貨。
深度學(xué)習超級計算機NVIDIADGX-1
深度學(xué)習最苛刻的部分是訓練。NVIDIA專(zhuān)為深度學(xué)習設計的PASCAL架構,助推深度學(xué)習加速高達65倍,并且能夠支持每個(gè)主要的深度學(xué)習框架。在此架構基礎上,NVIDIA創(chuàng )造了專(zhuān)為GPU深度學(xué)習所設計的超級計算機DGX1。
NVIDIA的DGX-1基于Tesla P100加速卡(研發(fā)費用高達20億美元)是世界上首款專(zhuān)為深度學(xué)習而打造的系統,具備全面集成的硬件和軟件,可以輕松快速地完成部署。NVIDIADGX-1革命性的性能可大幅加快訓練速度,成為世界上首款體積小性能強(單機箱)的深度學(xué)習超級計算機。

2013年-2015年,NVIDIA合作開(kāi)發(fā)深度學(xué)習項目的公司已增加了近35倍,數量超過(guò)3400家。醫療、生命科學(xué)、能源、金融服務(wù)、汽車(chē)、制造和娛樂(lè )業(yè)等產(chǎn)業(yè)均將從中收益,借助海量數據洞悉未來(lái)趨勢。

著(zhù)力自動(dòng)駕駛領(lǐng)域,提供軟硬件一體化開(kāi)發(fā)平臺
DRIVE CX和DRIVE PX系列自動(dòng)駕駛開(kāi)發(fā)平臺
2016年年初,NVIDIA 就推出了DRIVE CX、DRIVE PX和DRIVE PX2智能駕駛平臺。DRIVE CX座艙電腦是一款完整的軟硬件解決方案,可成就先進(jìn)的圖形與計算機視覺(jué)功能,滿(mǎn)足導航、信息娛樂(lè )、數字儀表組以及駕駛員監控等需要。DRIVE PX 2只有手掌大小,功率僅為10瓦,可以利用深度神經(jīng)網(wǎng)絡(luò )處理來(lái)自多個(gè)攝像頭和傳感器的數據,通過(guò)實(shí)時(shí)了解周邊環(huán)境、在高清地圖上精確定位,以及規劃安全行車(chē)路線(xiàn),實(shí)現安全的自動(dòng)巡航。
其中DRIVE PX 2能夠將外部傳感器獲取的圖像數據加工處理后制成單個(gè)的高精度點(diǎn)云。系統將所有DRIVE PX 2平臺的點(diǎn)云數據上傳至云端服務(wù)器,經(jīng)過(guò)超級計算機處理后,可融合為一副完整的高精度地圖。車(chē)內的DRIVE PX 2,云端的深度學(xué)習計算機配合發(fā)揮作用,形成了NVIDIA完整的自動(dòng)駕駛技術(shù)平臺解決方案。

評論