
多年來(lái),移動(dòng)處理器的生產(chǎn)商致力于優(yōu)化設計,以在有限的功耗預算、存儲空間和帶寬范圍內獲得最佳性能。過(guò)去,顯然這些考量因素在數據中心或個(gè)人電腦(PC)等市場(chǎng)并未得到重視。如今,傳統數據中心和PC市場(chǎng)的變革正在悄然發(fā)生——改變處理器設計規則,讓開(kāi)發(fā)人員重新考慮其芯片架構以獲得更高的性能功耗比。
移動(dòng)處理器設計原則運用于PC和數據中心
今天,越來(lái)越多的云游戲、數據挖掘、人工智能/數據分析和高性能計算均在云端實(shí)現。雖然這些應用的要求各不相同,但在不斷提高計算量的要求方面如出一轍。 數據中心無(wú)法通過(guò)不斷擴大物理占地面積來(lái)滿(mǎn)足這一需求。為了將運營(yíng)支出(OpEx)保持在可接受的范圍內,以及實(shí)現凈零(Net Zero)目標,企業(yè)需要在有限的空間內增加計算密度,從而獲得更高的計算性能。圖形處理器(GPU)、中央處理器(CPU)、人工智能(AI)加速器等處理元件必須在最小的功耗/散熱和面積預算內實(shí)現最高的性能。為此,遵循移動(dòng)設計原則進(jìn)行處理器的設計是一個(gè)理想的出發(fā)點(diǎn)。 分析PC市場(chǎng)的趨勢,也可以得出相似的結論。在傳統PC模式下,大部分功能被各自集成為一個(gè)個(gè)的獨立模組。但是,隨著(zhù)大多數組織希望擴大混合辦公模式,人們逐漸用筆記本電腦取代臺式機。將越來(lái)越多的功能(包括圖形處理、神經(jīng)網(wǎng)絡(luò )加速、安全、I/O等)集成到具有統一存儲器架構的單個(gè)系統級芯片(SoC)中,既可以提高性能,又能將功耗保持在最低水平。因此,下一代PC處理器看起來(lái)越來(lái)越像是智能手機處理器。
大型科技公司借助定制芯片設計實(shí)現差異化
隨著(zhù)摩爾定律的終結,行業(yè)再也不可能每?jì)赡瓿霈F一次性能提升。在此背景下,企業(yè)紛紛加入這場(chǎng)設計“競賽”,爭相以最佳的芯片,打造最好的用戶(hù)體驗。全球大型科技公司早已深諳此道,有備而來(lái)。它們正著(zhù)力自主設計定制芯片,以用于消費類(lèi)產(chǎn)品、PC或數據中心等。這些公司從現成可用的芯片轉向定制芯片,寄厚望于更好地掌控設計,贏(yíng)得優(yōu)勢。借助移動(dòng)設計原則進(jìn)行優(yōu)化的芯片,提供更高的集成度和更出眾的性能功耗比。
OEM替代方案
對于沒(méi)有內部硬件和軟件設計團隊,尚未著(zhù)手開(kāi)發(fā)定制芯片的原始設備制造商(OEM)而言,他們面臨的挑戰在于如何讓自己的設計脫穎而出,與高度優(yōu)化的架構相媲美。這些OEM使用的芯片大部分都是現成可用的,可能會(huì )使他們處于劣勢。許多為PC和數據中心設計的芯片是“暴力”解決方案,雖然可以提供所需的性能,但通常過(guò)于耗電,太占用內存/帶寬,缺乏競爭力。此外,這些芯片在可用的特定軟件和操作系統方面也存在限制。
部分移動(dòng)市場(chǎng)的SoC供應商開(kāi)始進(jìn)入數據中心和PC市場(chǎng),期望瓜分現有玩家的部分市場(chǎng)份額,但它們的數量少之又少,很難幫助OEM廠(chǎng)商實(shí)現既創(chuàng )新又控制成本的差異化。因此,一些行業(yè)替代方案正在應運而生。我們不乏看到很多廠(chǎng)商正在考慮基于RISC-V架構的CPU解決方案。但是,單一的CPU設計無(wú)法完全解決OEM目前面臨的激烈的競爭困局。OEM需要放眼整個(gè)數據中心的架構結構提升整體方案的創(chuàng )新,從而增加自身的競爭力。
可擴展的異構架構是關(guān)鍵
通過(guò)異構計算,靈活利用CPU,GPU等計算單元,實(shí)現硬件最大利用率以達到計算性能的優(yōu)化提升,同時(shí)滿(mǎn)足效率和功耗比優(yōu)化。異構計算架構為數據中心不斷提高的計算量要求提供了靈活陣列工作方案。目前很多半導體廠(chǎng)商都在研究相關(guān)的產(chǎn)品和應用,以賦能OEM市場(chǎng)競爭力。傳統的GPU IP公司Imagination就在去年推出了其CPU產(chǎn)品線(xiàn),并強化了異構計算的研發(fā),意圖通過(guò)產(chǎn)品組合的優(yōu)化提升,給客戶(hù)提供更加完善的異構計算解決方案,從而更好的服務(wù)客戶(hù)以適應未來(lái)高性能計算的需求。
移動(dòng)GPU奠定基礎
移動(dòng)GPU是打造高效異構設計的理想切入點(diǎn)。與試圖將高端GPU強行納入移動(dòng)功耗預算范圍相比,把移動(dòng)GPU升級應用于數據中心和PC領(lǐng)域將更加有意義。因為移動(dòng)GPU天生為”小而美”而生。移動(dòng)GPU廠(chǎng)商開(kāi)發(fā)擁有很多專(zhuān)利技術(shù),以最大程度的實(shí)現GPU高性能低功耗。在數據中心和PC粗放式單一追求高性能GPU的背景下,這些技術(shù)優(yōu)勢可以讓移動(dòng)GPU廠(chǎng)商更加具有競爭優(yōu)勢,并給OEM提供更多的管理附加價(jià)值。 例如GPU硬件虛擬化,分塊式延遲渲染(TBDR),實(shí)時(shí)硬件光線(xiàn)追蹤(Ray Tracing)等。分塊式延遲渲染(TBDR)技術(shù)是將幾何數據分割成小區域(圖塊),并統一處理。由于每個(gè)圖塊都經(jīng)過(guò)光柵化和單獨處理,渲染的尺寸非常小,因此可以將所有數據保存在快速運行的片上存儲器中。這項技術(shù)為M1的圖形處理奠定了基礎。
對于諸如安卓云游戲等應用場(chǎng)景,數據中心需要靈活處理多個(gè)用戶(hù)的不同游戲消費場(chǎng)景。在多個(gè)小型GPU上處理多個(gè)小型并發(fā)工作負載的方法比使用傳統桌面GPU更高效。云游戲產(chǎn)業(yè)鏈都在強化GPU硬件虛擬化技術(shù)的開(kāi)發(fā)應用以降低成本。移動(dòng)GPU通過(guò)向上擴展分散式多核移動(dòng)GPU架構,使每個(gè)GPU既可支持更多用戶(hù),同時(shí)為云端的許多用戶(hù)提供更高的能效。
增加高效的片上AI處理(正如M1所示)是OEM的另一個(gè)機會(huì )。由于片上AI處理尚未成為PC的標準,OEM可以利用這項能力來(lái)支持超分辨率降噪、音頻命令、安全等新興應用。這種AI功能通常需要巨大的計算能力,而使用基于移動(dòng)設計原則設計的神經(jīng)網(wǎng)絡(luò )加速器(NNA)IP便可以在SoC上集成高效、高度可靠的AI推理功能。
設計專(zhuān)用芯片——不僅服務(wù)于大型科技公司
需要通過(guò)基于移動(dòng)設計原則設計的可擴展IP內核,以創(chuàng )造高能效、高帶寬和高性能的設計。借助這種專(zhuān)為異構架構設計的處理器,他們可以創(chuàng )建專(zhuān)用、高效的新型解決方案。這可以幫助OEM提供極具競爭力和差異化的產(chǎn)品,牢牢把握企業(yè)的未來(lái)發(fā)展方向。
來(lái)源:祺芯半導體
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。