加州大學(xué)團隊開(kāi)發(fā)異構編程新模型,開(kāi)辟提升處理器性能新路徑

然而,由于傳統的編程框架,包括領(lǐng)域特定語(yǔ)言(domain-specific languages),只能將代碼區域(code region)分配給一種處理器,使得其他計算資源閑置而無(wú)法用于當前函數的運算,因此現有編程模型并不能充分發(fā)揮異構模型的潛力。 而這項名為“同步異構多線(xiàn)程”(simultaneous and heterogenous multithreading,SHMT)的編程和執行模型,旨在克服現有編程模型未能充分利用異構計算系統潛力的限制。 與傳統模型不同,SHMT 可以充分利用異構的并行類(lèi)型。通過(guò)結合多種處理單元(如 CPU、GPU、TPU 等)的優(yōu)勢,這種模型能有效提升計算效率和能效。

不過(guò),要將同一函數的計算分解到不同類(lèi)型的計算資源中,系統面臨以下三個(gè)挑戰: 第一,SHMT 需要某種機制來(lái)描述和劃分在不同的計算分區上的等效操作和數據; 第二,SHMT 必須能夠高效地協(xié)調異構硬件上的執行; 第三,由于不同的硬件單元會(huì )提供不同質(zhì)量水平的結果,SHMT 必須在不產(chǎn)生大量額外開(kāi)銷(xiāo)的情況下確保結果。 為了解決這些困難,研究人員開(kāi)發(fā)了一個(gè)由三個(gè)主要部分組成的系統架構: 首先,SHMT 引入了一種虛擬硬件的概念,允許開(kāi)發(fā)者將計算任務(wù)借助一系列虛擬操作(Virtual Operations,VOPs)的形式從 CPU“卸載”。
VOPs 定義了 SHMT 底層硬件可支持的可用操作,進(jìn)而使整個(gè) SHMT 子系統抽象為一個(gè)單一且強大的加速器。

它將 VOPs 進(jìn)一步分解為高級操作(High-Level Operations,HLOPs),這些 HLOP 作為 SHMT 中的基本調度單位,每個(gè) HLOP 負責執行 VOP 運算的特定部分,且均具有硬件無(wú)關(guān)性,確保了運行時(shí)系統能夠根據實(shí)際情況靈活調整任務(wù)分配。 更進(jìn)一步地,SHMT 采用了一種質(zhì)量感知的工作竊?。≦uality-Aware Work-Stealing,QAWS)調度策略,以?xún)?yōu)化資源利用率和提升系統性能。
這種策略通過(guò)動(dòng)態(tài)調整工作負載分配來(lái)平衡各種硬件資源的使用,減少空閑時(shí)間,避免性能瓶頸,同時(shí)保證了任務(wù)執行的質(zhì)量。
圖丨SHMT 概覽(來(lái)源:the 56th Annual IEEE/ACM International Symposium on Microarchitecture)
該系統原型由下圖所示部分構成:

在基準應用程序上的檢測結果顯示,相較于基準方法,采用性能最佳策略的 QAWS 的 SHMT 速度提高了 1.95 倍。 實(shí)驗表明,所有 QAWS 策略均能有效地提高結果質(zhì)量,MAPE(平均絕對百分比誤差)平均值低于 2%,接近于手動(dòng)優(yōu)化的 Oracle 場(chǎng)景。且無(wú)論采樣率如何變化,QAWS-TS 策略的性能都名列前茅。

實(shí)驗結果顯示,與基線(xiàn) GPU 相比,SHMT 在 QAWS-TS 策略下平均減少了 51% 的能耗和 78% 的能量延遲積。
同時(shí),得益于 Edge TPU 專(zhuān)用邏輯提供的加速功能,以及 SHMT 并行編程模型使用的低數據交換算法,這一模型也不會(huì )導致顯著(zhù)的內存和通信開(kāi)銷(xiāo)。

近日,相關(guān)論文以《同步異構多線(xiàn)程》(Simultaneous and Heterogenous Multithreading)為題,在加拿大多倫多舉行的第 56 屆 IEEE/ACM 國際微架構研討會(huì )上發(fā)表[1]。
加州大學(xué)河濱分校的博士研究生徐冠杰(Kuan-Chieh Hsu)為第一作者,曾宏偉副教授擔任通訊作者。
曾宏偉對媒體表示,“你不必增加新的處理器,因為現有的就足夠了。”因此,僅需使用現有的處理組件,就相當于降低了計算機硬件成本,同時(shí)減少了服務(wù)器等設備運行時(shí)的能源消耗,也減少了碳排放與水消耗。 但這一模型也面臨一些挑戰與局限性。例如,如何有效管理和調度多種類(lèi)型的計算資源以實(shí)現最優(yōu)能效、如何降低編程模型的復雜性、如何降低通信開(kāi)銷(xiāo)以及如何擴展應用平臺與場(chǎng)景等問(wèn)題,而這些也正是曾宏偉團隊未來(lái)的研究方向。
參考文獻:
1.Kuan-Chieh Hsu and Hung-Wei Tseng. 2023. Simultaneous and Heterogenous Multithreading. In Proceedings of the 56th Annual IEEE/ACM International Symposium on Microarchitecture (MICRO '23). Association for Computing Machinery, New York, NY, USA, 137–152. https://doi.org/10.1145/3613424.3614285
2.https://news.ucr.edu/articles/2024/02/21/method-identified-double-computer-processing-speeds
支持:Ren
排版:劉雅坤
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。