<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 網(wǎng)格中比較CPU計算能力的一種方法

網(wǎng)格中比較CPU計算能力的一種方法

作者：時(shí)間：2012-04-20 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

引言

本文引用地址：http://dyxdggzs.com/article/171585.htm

在網(wǎng)格計算中，常常需要使用多臺計算機協(xié)同工作完成一臺超級計算機才能完成的計算任務(wù)，為實(shí)現上述目標，首先應通過(guò)網(wǎng)格信息服務(wù)獲得網(wǎng)格中各臺主機CPU計算能力的指標，然后進(jìn)行判斷選擇，決定由哪些主機參與計算。

當前，已有的網(wǎng)格信息服務(wù)模塊、網(wǎng)格監控模塊，如MDS2將系統平均負載作為反映CPU狀態(tài)的動(dòng)態(tài)指標提供給用戶(hù)；另外，通過(guò)系統命令或系統調用也可以獲得 CPU使用率這個(gè)動(dòng)態(tài)指標。系統平均負載是在特定時(shí)間間隔內運行隊列中的平均進(jìn)程數，CPU使用率表示CPU使用程度的指標，能夠反映出CPU的工作狀態(tài)，但由于網(wǎng)格中CPU型號性能的差異，因此，無(wú)法用它們直接比較網(wǎng)格中CPU的計算能力。

為直接比較網(wǎng)格中主機 CPU的計算能力，獲得具有可比性的反映CPU計算能力的指標，我們采用計算量動(dòng)態(tài)選擇算法，在各臺主機上周期性地瞬間執行計算量適中的Whestone 基準計算，通過(guò)PAPI接口編程對CPU所完成的浮點(diǎn)數計算進(jìn)行精確計數，用得到的每秒百萬(wàn)浮點(diǎn)數MFLOPS作為比較主機CPU計算能力的指標，定義為 WMFLOPS。得到WMFLOPS后，通過(guò)Globus提供的監控和發(fā)現服務(wù)（Monitoring and Discovery Service，MDS），將該指標作為資源信息進(jìn)行發(fā)布，作為比較網(wǎng)格節點(diǎn)CPU計算能力的依據，為用戶(hù)選擇計算節點(diǎn)提供參考。我們編寫(xiě)了程序 WfpSensor用于上述方法的實(shí)現。WfpSensor作為傳感器工作于網(wǎng)格中的各個(gè)節點(diǎn)，周期性地對CPU進(jìn)行計算測試，獲得WMFLOPS的返回值，同時(shí)，WfpSensor也是MDS服務(wù)中的本地信息提供者，定時(shí)將最新的WMFLOPS值傳遞給MDS系統，供用戶(hù)查閱。

計算測試子程序

CPU 的計算能力主要體現在浮點(diǎn)數計算能力、定點(diǎn)數計算能力和矩陣計算能力等方面，其中某一類(lèi)程序在CPU上運行的效果并不能全面地反映CPU的計算能力，所以許多國際基準組織開(kāi)發(fā)了測試CPU計算能力的基準測試程序，在這類(lèi)程序中進(jìn)行的操作和運算可以相對全面客觀(guān)地考察CPU的計算能力。本文方法采用綜合型基準測試程序Whestone作為WfpSensor的計算測試子程序，Whestone程序中主要包括浮點(diǎn)運算、整數運算、涉及到數組下標索引、子程序調用、參數傳遞、條件轉移和三角/超越函數等，可以綜合考察CPU提供的計算能力。

返回指標WM FLOPS

WfpSensor 進(jìn)程對CPU進(jìn)行計算測試后，取出CPU在測試過(guò)程中的指標來(lái)反映CPU的計算能力。絕大多數網(wǎng)格計算都是科學(xué)計算，而浮點(diǎn)計算是科學(xué)計算程序中最主要的計算，所以選用每秒百萬(wàn)浮點(diǎn)數MFLOPS作為反映CPU計算能力的指標。MFLOPS反映了CPU的浮點(diǎn)計算能力，并且MFLOPS是基于操作而非指令的，可以用它來(lái)比較兩種不同CPU的計算能力。由于是調用Whestone程序進(jìn)行測試所得的結果，因此定義該指標為WMFLOPS。

指標精確計數

指標確定后，如何在WfpSensor中精確得到Whestone計算結束后的WMFLOPS值成為問(wèn)題的關(guān)鍵。由美國田納西大學(xué)計算機學(xué)院創(chuàng )新計算實(shí)驗室開(kāi)發(fā)的標準應用編程接口PAPI（ portable application programming interface）能夠滿(mǎn)足上述要求。該軟件通過(guò)CPU上的硬件計數器，對CPU運行時(shí)產(chǎn)生的某些事件進(jìn)行計數，并建立了一個(gè)標準應用編程接口方便用戶(hù)讀出計數器的值，通過(guò)這些值就可以了解當前CPU的工作狀態(tài)。由于CPU生產(chǎn)廠(chǎng)商及型號的不同，CPU硬件計數器所計數的硬件事件會(huì )有所不同，為標準化指標的名稱(chēng)，使同一工具可以計數相似的可比較事件，促進(jìn)跨平臺調試程序的能力，PAPI開(kāi)發(fā)者選擇了一套和調試應用程序相關(guān)的硬件事件稱(chēng)為預定義事件，作為反映CPU當前工作狀態(tài)的指標。這些指標是跨平臺的通用事件，包括了大部分主流RISC類(lèi)事件，并且盡可能把這些預定義事件映射到給定CPU的硬件計數器事件中。在本文方法中，使用了PAPI_FP_INS這個(gè)PAPI預定義事件，它表示進(jìn)程執行過(guò)程中完成的浮點(diǎn)數計算。PAPI提供了精確的計時(shí)器，精確到微秒，能夠準確地對進(jìn)程的執行時(shí)間進(jìn)行計時(shí)，如果經(jīng)計數，PAPI_FP_INS事件總數為n，計算執行時(shí)間為t（單位：μs），那么WMFLOPS=n/t。

計算量動(dòng)態(tài)選擇

采用計算測試CPU的計算能力，必須保證以下兩點(diǎn)：

（1）測試進(jìn)程應盡可能不影響CPU的正常工作，當然由于測試進(jìn)程的引入必將影響到CPU正常運行，應設法讓這種影響降到一個(gè)可以接受的程度，并且使計算給系統帶來(lái)的開(kāi)銷(xiāo)盡可能小。

（2）測試進(jìn)程要有一定的計算量，如果計算量過(guò)小，會(huì )使初始化、函數調用等操作消耗的時(shí)間在進(jìn)程的執行時(shí)間t中占有較大的比重，從而使WMFLOPS的值比真實(shí)值小，影響測試結果的精確性。

為同時(shí)保證（1）需要較小的計算量和（2）需要較大的計算量，選擇合適的測試計算量十分重要，為此，提出采用計算量動(dòng)態(tài)選擇的算法確定計算量。

計算量的大小控制可以通過(guò)改變WfpSensor中調用Whestone程序的次數（NUM_LOOPS）實(shí)現。假定使計算執行時(shí)間t（單位：s）在 0.5～1.5的計算量是合理值，計算量調節系數為xs。WfpSensor啟動(dòng)時(shí)，NUM_LOOPS賦初值。調用Whestone計算結束后，如果：

（1） 0.5≤t≤1.5，在合理區間內，NUM_LOOPS的值保持不變。

（2） t>1.5，計算量偏大，下次測試應減小Whestone的調用次數，則NUM_LOOPS=NUM_LOOPS/xs。xs為t四舍五入后的整數值。

（3） t0.5，計算量偏小，下次測試應增加Whestone的調用次數，則NUM_LOOPS=NUM_LOOPS3xs。xs為（1/t）四舍五入后的整數值。

具體算法如下：

start_usec=PAPI_get_real_usec（）；//通過(guò)PAPI函數獲得計算開(kāi)始時(shí)的時(shí)刻

do_wst（NUM_LOOPS）；//Whestone寫(xiě)成函數，對它進(jìn)行調用，NUM_LOOPS是調用次數

end_usec=PAPI_get_real_usec（）；//通過(guò)PAPI函數獲得計算結束時(shí)的時(shí)刻

t=（end_usec-start_usec）；//獲得計算執行的時(shí)間

if（t>1.5）//根據本次計算執行時(shí)間決定下次測試的調用次數

{

if（（t-floor（t））>0.5）//取最靠近t的整數

xs=floor（t）+1；

else

xs=floor（t）

NUM_LOOPS=NUM_LOOPS/xs；//修改調用次數

}

else

if（t0.5）

{

if（（1/t-floor（1/t））>0.5）//取最靠近1/t的整數

xs=floor（1/t）+1；

else

xs=floor（1/t）；

NUM_LOOPS =NUM_LOOPS3xs；//修改調用次數

}

上一頁(yè) 1 2 3 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：能力方法計算 CPU 比較 網(wǎng)格

評論

相關(guān)推薦

實(shí)時(shí)操作系統與通用操作系統的一些比較（轉載）

jackwang | 2002-05-14

中國科學(xué)院院士：CPU、GPU架構上國人沒(méi)貢獻很遺憾應加強創(chuàng )新

嵌入式系統 CPU GPU 架構 | 2024-07-12

龍芯 3A6000 主板首次殺入美國市場(chǎng)：372.91 美元起，可選 12 種配置版本

國際視野龍芯 CPU 主板 PC | 2024-07-01

嵌入式Web視頻點(diǎn)播系統實(shí)現方法

jackwang | 2002-05-29

粗粒度的時(shí)空計算

視頻粗粒度嵌入式計算 eepw會(huì )展 | 2012-10-31

硬件工程師手冊

資源下載華為硬件工程師接口 CPU 單片機 | 2008-01-14

運算放大器失調調整的方法

設計方案運算放大器失調調整方法 | 2009-07-06

運放的調零方法

設計方案運放方法 | 2009-07-06

擴展輸出幅度的兩種方法

設計方案擴展輸出幅度兩種方法 | 2009-07-06

RTOS和CPU指令設計—uc/os—||| 的啟示

視頻中國芯 RTOS CPU | 2011-01-07

數字示波器的使用方法

視頻數字示波器使用方法 | 2013-12-26

英特爾 Panther Lake 移動(dòng)處理器規格曝光：最高“4+8+4”16 核 CPU、12 Xe3 核顯

消費電子英特爾 CPU | 2024-07-16

HI-FI必讀

資源下載高保真 HI-FI 音響比較 | 2007-02-16

100％自主龍芯架構！北航成功流片兩款CPU

EDA/PCB 龍芯架構北航 CPU | 2024-07-15

運放通用調零方法

設計方案運放通用方法 | 2009-07-06

毛德操老師《RISC-V CPU芯片設計：香山源代碼剖析》新書(shū)發(fā)布會(huì )在北京舉辦

嵌入式系統香山芯片 RISC-V CPU | 2024-06-17

高性能可擴展指令集計算

jackwang | 2002-05-14

RISC-V CPU進(jìn)入mini-ITX主板

嵌入式系統 Jupiter SpacemiT K1/M1 AI RISC-V CPU mini-ITX 主板 | 2024-07-02

[新書(shū)介紹]: 嵌入式計算系統設計原理(老站轉)

amine | 2002-05-16

嵌入式CPU的演變和發(fā)展

視頻 MIPS 嵌入式 CPU | 2012-04-28

Motorola 68K系列CPU選擇參考文檔

資源下載 Motorola 68K系列 CPU | 2007-02-09

Protel_book-第九章

資源下載 PROTEL PROTEL PCB 手工布線(xiàn) 網(wǎng)格 | 2007-12-29

[轉帖]實(shí)時(shí)操作系統與通用操作系統的一些比較

amine | 2002-05-16

Intel 收購 NVDIA 意欲何為

視頻 Intel NVDIA CPU GPU 移動(dòng)處理 | 2012-12-26

運放輸出短路保護方法

設計方案運放輸出短路保護方法 | 2009-07-06

被英特爾拖累：有游戲開(kāi)發(fā)商將服務(wù)器的CPU換成了AMD

消費電子英特爾 AMD CPU | 2024-07-16

奕斯偉計算公司在最新的RISC-V邊緣計算SoC中將SiFive CPU、Imagination GPU和自有NPU結合集成

智能計算奕斯偉 RISC-V SiFive CPU Imagination GPU NPU | 2024-06-25

全新芯片技術(shù)亮相：不增加功耗 / 熱量提高 CPU 性能最高 100 倍

EDA/PCB CPU 工藝荷蘭 | 2024-06-19

多功能CPU監控器X5045

資源下載 CPU 監控器 X5045 | 2007-02-16

Arm發(fā)布全新終端計算子系統，引領(lǐng)AI驅動(dòng)下的移動(dòng)設備性能革新

手機與無(wú)線(xiàn)通信 arm CPU GPU 終端計算子系統 CSS | 2024-06-05

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>