Kalray MPPA解決方案實(shí)現無(wú)處不在的低功耗、實(shí)時(shí)單芯片超算
超級計算,對很多人來(lái)說(shuō)并不陌生但仿佛又離得很遠,或許大家對它的了解也僅僅限于“天河”超級計算機。其實(shí),隨著(zhù)越來(lái)越多的應用對實(shí)時(shí)數值計算和數據處理提出極高的要求,超級計算正在越來(lái)越多地出現在與人類(lèi)生活息息相關(guān)的領(lǐng)域。尤其是近些年來(lái),隨著(zhù)云計算、大數據等IT新概念和新技術(shù)的出現,以及先進(jìn)無(wú)損音視頻處理和自動(dòng)駕駛設備等嵌入式高性能計算的興起,使很多原有應用迎來(lái)了突破性進(jìn)展,并促使很多新的IT應用模式出現。而在這些應用背后,許多廠(chǎng)商正在全力實(shí)現的“嵌入式”實(shí)時(shí)超級計算解決方案,可以提供芯片級的高性能數據運算和處理能力。為此,北京華興萬(wàn)邦管理咨詢(xún)有限公司走訪(fǎng)了業(yè)內率先實(shí)現單芯片超算(Supercomputing on a Chip)商用的法國Kalray公司,為大家一探“片上超算”給行業(yè)帶來(lái)的新機會(huì )。
本文引用地址:http://dyxdggzs.com/article/281003.htm面向超級計算的多核處理器
為了完成普通PC或服務(wù)器無(wú)法完成的大量、復雜的計算任務(wù),超級計算機要求擁有為數眾多的處理器。然而,隨著(zhù)對運算速度越來(lái)越高的追求,單核處理器已經(jīng)無(wú)法滿(mǎn)足超級計算的要求,因為無(wú)休止地增加單核處理器的數量不但會(huì )造成成本和功耗的大量增加,而且性能也無(wú)法呈現幾何級數的增長(cháng)。于是,多核技術(shù)開(kāi)始被大量應用于超級計算當中。以中國的“天河二號”超級計算機為例,其使用的主處理器和協(xié)處理器目前均為Intel公司的多核處理器。
目前,市場(chǎng)上研發(fā)并供應多核處理器芯片的廠(chǎng)商為數眾多,以Intel和AMD兩大處理器廠(chǎng)商為首,不同的多核處理器所面向的應用領(lǐng)域也不盡相同。除了面向PC應用的2核、4核處理器和面向手機和平板電腦的4核、8核處理器外,一些供應商推出的8核、16核處理器也已實(shí)現全面的商用,例如XMOS公司的xCORE系列多核處理器已被高解析度音頻、千兆網(wǎng)速物聯(lián)網(wǎng)等領(lǐng)域中的產(chǎn)品、解決方案所采用,該公司全新的xCORE-200多核微控制器通過(guò)在單一器件上集成16個(gè)或更多高性能32位RISC處理器內核,成為了高性能用戶(hù)、專(zhuān)業(yè)音頻與新興千兆網(wǎng)速物聯(lián)網(wǎng)(IoT)應用的完美可編程平臺。
在眾多的多核處理器供應商中,有一家面向超級計算相關(guān)應用的廠(chǎng)商正在越來(lái)越多地引起業(yè)界的關(guān)注,這就是全球首家可以提供256核以上處理器芯片的廠(chǎng)商——法國公司Kalray。Kalray公司是在單芯片上實(shí)現超級計算(Supercomputing on a Chip™)的發(fā)明者,其大規模并行處理器陣列芯片MPPA®(Massively Parallel Processor Array)處理器采用臺積電(TSMC)的28nm工藝制程,擁有超過(guò)256個(gè)可以進(jìn)行C/C++編程的內核。該公司的單芯片超算解決方案可以為兩大類(lèi)應用提供高性能、低功耗和實(shí)時(shí)等特性,一類(lèi)是在數據中心、視頻處理等應用中卸載主處理器的任務(wù),另一類(lèi)是需要較大量數據處理、高實(shí)時(shí)性和低功耗的嵌入式應用。下面為您具體介紹該公司的解決方案及其商業(yè)應用。
Kalray公司的256核MPPA處理器芯片
低功耗256核處理器芯片和標準C/C++編程環(huán)境
Kalray公司是一家成立于2008年的無(wú)晶圓廠(chǎng)半導體公司,它是開(kāi)發(fā)多核處理器解決方案的先鋒廠(chǎng)商。該公司創(chuàng )新的MPPA架構獨一無(wú)二地提供單芯片超算解決方案,其可以為視頻、網(wǎng)絡(luò )、電信、大數據等領(lǐng)域的云計算應用實(shí)現實(shí)時(shí)加速,還可以為航空航天、國防、汽車(chē)等領(lǐng)域的嵌入式應用提供嵌入式高性能運算能力。Kalray公司的總部位于法國,包括位于巴黎和歐洲硅谷格勒諾布爾市(Grenoble)兩個(gè)地點(diǎn)的辦公室,此外,其在美國加州和日本東京還設有分公司。
Kalray公司的完整解決方案包括MPPA系列多核處理器、PCIe Gen3加速卡、提供網(wǎng)絡(luò )加速支持的開(kāi)源網(wǎng)絡(luò )接口卡(Open NIC),以及軟件開(kāi)發(fā)工具包。該解決方案可以提供行業(yè)領(lǐng)先的低計算功耗,具有時(shí)間可預測性和低延遲性,以及獨一無(wú)二的處理擴展性和系統密度,可以在同一塊片芯上實(shí)現多種異構的應用,同時(shí)擁有很好的可編程性(包括標準C/C++和OpenCL)。
MPPA多核處理器包括Andey MPPA和Bostan MPPA兩款產(chǎn)品。其中Andey為第一代MPPA處理器,已于2013年第1季度開(kāi)始供貨。它擁有超過(guò)256個(gè)可以進(jìn)行32位超長(cháng)指令字C/C++編程的內核,單精度浮點(diǎn)運算速度可以達到210 GFLOPS(每秒十億次浮點(diǎn)運算),雙精度浮點(diǎn)運算速度可達70 GFLOPS,運算速度可達0.7 TOPS(每秒萬(wàn)億次運算)。該處理器擁有兩塊帶寬為12.8GB/s的64位DDR3內存,以及兩個(gè)由DMA支持的PCIe Gen3×8接口。Bostan為該公司即將推出的第二代MPPA處理器,目前已完成流片及樣片的封裝,將于2015年第4季度向先期客戶(hù)供貨。它的單精度浮點(diǎn)運算速度可以達到840 GFLOPS,雙精度浮點(diǎn)運算速度可達420 GFLOPS,運算速度可達1.4 TOPS,其他性能相比Andey MPPA有較大幅度的提升。
MPPA多核處理器采用Kalray獨一無(wú)二的架構設計。每個(gè)處理器芯片擁有4個(gè)四核主CPU和 16個(gè)計算集群,每個(gè)計算集群中又包括16個(gè)用戶(hù)核和1個(gè)系統核,每個(gè)用戶(hù)核則采用Kalray擁有專(zhuān)利的超長(cháng)指令字架構進(jìn)行設計。同時(shí),其片上的DDR存儲器和以太網(wǎng)及PCIe接口模塊支持了數據的低延遲處理,并使芯片的整體功耗遠遠低于通用的多芯片組功耗,Andey MPPA處理器的典型功耗為12W,Bostan MPPA處理器的功耗為11W-30W。
Kalray公司獨一無(wú)二的處理器架構
為了驗證其MPPA處理器的高性能、低功耗特性,并推動(dòng)其芯片產(chǎn)品的商用化,Kalray推出了采用MPPA處理器的系列網(wǎng)絡(luò )卡。Kalray的PCIe Gen3加速卡包括TurboCard2和TurboCard3兩款產(chǎn)品。TurboCard2加載了4塊Andey MPPA芯片,浮點(diǎn)運算速度可以達到0.9 TFLOPS(每秒萬(wàn)億次浮點(diǎn)運算),存儲容量高達32GB,擁有8塊DDR3內存(總帶寬達80GB/s),并配有C/C++ GNU編譯器環(huán)境。TurboCard3是TurboCard2的下一代產(chǎn)品,將于2015年底供貨,其加載了4塊Bostan MPPA芯片,浮點(diǎn)運算速度可以達到3.4 TFLOPS。Kalray的開(kāi)源網(wǎng)絡(luò )接口卡ONIC80也將于2015年底開(kāi)始供貨,它是完全可編程的網(wǎng)卡,運行Bostan MPPA芯片,擁有PCIe Gen3×16接口和8GB存儲容量,其大小與普通圖形加速單元類(lèi)似,功耗為40W,可以使數據中心變得更加緊湊和冷靜。
Kalray公司的PCIe Gen3加速卡TurboCard2
開(kāi)發(fā)工具體系是處理器生態(tài)體系中另一項非常重要的指標。為了便于工程師針對不同的應用開(kāi)發(fā)自己的超算解決方案,Kalray提供了方便易用、內容豐富的軟件開(kāi)發(fā)工具包,包括標準C/C++編程環(huán)境,模擬器、編譯器、調試器和系統跟蹤,第三方實(shí)時(shí)操作系統(如Linux、風(fēng)河)和設備驅動(dòng)程序,面向CPU的基礎C編程和Lib編程,面向DSP的POSIX多線(xiàn)程編程,以及面向GPU的OpenCL編程??梢哉f(shuō),該軟件開(kāi)發(fā)工具包提供了眾多高性能應用所需求的軟件,工程師不需要針對該系列處理器進(jìn)行大量重新學(xué)習就可以上手,并力求最大限度地發(fā)揮MPPA多核處理器的全部性能。
Kalray公司的軟件開(kāi)發(fā)工具包
目標市場(chǎng):數據中心和關(guān)鍵任務(wù)型嵌入式應用
通過(guò)上述對Kalray公司各種硬件產(chǎn)品性能的描述可以看出,它們能夠在很多對數據運算和處理有高要求的應用領(lǐng)域發(fā)揮重要作用,加上軟件開(kāi)發(fā)工具包提供的強力支持,其整體解決方案擁有非常廣闊的應用空間。該公司的銷(xiāo)售和營(yíng)銷(xiāo)副總裁Jean-Pierre Demange向分析師介紹:“在數據中心的工作過(guò)程中,隨著(zhù)大量應用轉向云端,數據通信量的激增,以及新數據中心體系的進(jìn)一步虛擬化需求,開(kāi)始出現一種逐漸增長(cháng)的需求,即從主流處理器(x86)向高性能、低功耗、低延遲、完全可編程的協(xié)處理器進(jìn)行集中、實(shí)時(shí)卸載處理的需求。Kalray的處理器和PCI卡可以提供獨一無(wú)二的解決方案來(lái)幫助數據中心實(shí)現這一功能,主要應用范圍包括智能網(wǎng)卡、智能存儲、運算加速、視頻編碼等。”
“除數據中心外,我們的解決方案還有一個(gè)重要的目標應用市場(chǎng),那就是關(guān)鍵任務(wù)型嵌入式應用。”Kalray公司的銷(xiāo)售和營(yíng)銷(xiāo)副總裁Jean-Pierre Demange繼續說(shuō)道。“關(guān)鍵任務(wù)型嵌入式應用市場(chǎng)要求在固定的占板面積上提供越來(lái)越高的計算能力,以及在同一塊片芯上擁有越來(lái)越高的功能集成度,同時(shí)還要保留實(shí)時(shí)性支持和安全規范,而目前其他現有的多核架構尚無(wú)法滿(mǎn)足這些規范和要求的認證。Kalray是全球首家可以為關(guān)鍵任務(wù)型嵌入式應用提供全認證多核解決方案的公司,我們可以為航空航天、國防、自動(dòng)汽車(chē)、機器人和多軸飛行器等應用領(lǐng)域提供支持。”
Kalray公司的銷(xiāo)售與營(yíng)銷(xiāo)副總裁Jean-Pierre Demange、首席執行官Eric Baissus和商務(wù)總監Stephane Cordova(從左至右)向華興萬(wàn)邦分析師展示其產(chǎn)品
目前,Kalray公司已對其后續產(chǎn)品進(jìn)行了合理的規劃,該公司的首席執行官Eric Baissus介紹道:“我們正在對第三代MPPA多核處理器Coolidge制定技術(shù)規范,這款芯片的單精度浮點(diǎn)運算速度預計將高于1200 GFLOPS,雙精度浮點(diǎn)運算速度預計將高于600 GFLOPS,計劃2017年初生產(chǎn)樣片,2017年年內實(shí)現量產(chǎn)。”此外,關(guān)于未來(lái)對中國市場(chǎng)的開(kāi)發(fā),Eric Baissus先生也表達了自己的觀(guān)點(diǎn):“目前,我們與中國企業(yè)的合作還較少,我們希望下一步能夠加強與中國市場(chǎng)的聯(lián)系,并愿意為中國的超算中心和高性能嵌入式應用提供支持。”
c++相關(guān)文章:c++教程
評論