多核計算:精準模擬評估多核芯片的性能
過(guò)去的十幾年,計算機芯片制造商一直通過(guò)給芯片添加更多的核以提高芯片的速度?,F在大多制造商提供8核、10核甚至是12核的芯片。
本文引用地址:http://dyxdggzs.com/article/149280.htm但如果芯片繼續按照以往的做法來(lái)提高,那么芯片很快就會(huì )需要數百甚至成千上萬(wàn)個(gè)核。當然,學(xué)術(shù)界和業(yè)界的研究人員對提高多核芯片的性能有各種各樣的方法,但是他們的方法要想工作的好也得需要24核或48核的芯片,當核的數量更高時(shí)這就會(huì )帶來(lái)很大的問(wèn)題。而目前,也沒(méi)有一個(gè)芯片制造商能提供充分的證據來(lái)證明他們在嘗試芯片設計的革新。
如今,麻省理工學(xué)院專(zhuān)注于計算機功能結構的研究小組開(kāi)發(fā)出了一個(gè)叫做“大黃蜂”( Hornet)的軟件模擬器,相比于以往的種種方法,它可以更精確的模擬多核芯片的性能。他們利用“大黃蜂”分析了一種多核計算技術(shù),并發(fā)現了一個(gè)其他模擬都沒(méi)有注意到的致命瑕疵。
通過(guò)帶有好幾百個(gè)核的芯片的數據流是非常復雜的,以往的軟件加速器一直是犧牲部分準確性而換來(lái)效率。對于更精確的模擬器來(lái)說(shuō),研究人員們通常使用可編程的芯片來(lái)模仿多核芯片的行為。各種各樣的計算機任務(wù)是通過(guò)一個(gè)芯片的許多部件(靠一個(gè)任務(wù)時(shí)鐘來(lái)同步)來(lái)執行的,在每一次“時(shí)鐘周期”(clock cycle)里,每個(gè)部件執行一項任務(wù)。“大黃蜂”比以往的方法要慢很多,但是它能提供一個(gè)相當于1000核芯片的“周期精確”的模擬。李哲明(音譯,Myong Hyon Cho)是該項目的開(kāi)發(fā)者之一,他表示,“‘周期精確’意味著(zhù)最終結果會(huì )精確到單個(gè)周期的水平,比如,該軟件可以讓這項任務(wù)進(jìn)行1223392個(gè)周期直到完成。”
現有的模擬器擅長(cháng)評估芯片的常規性能,但是它們可能會(huì )遺漏那些不常見(jiàn)的問(wèn)題。而“大黃蜂”更可能把這些難發(fā)現的罕見(jiàn)問(wèn)題偵查出來(lái),它可以識別一種叫做“死鎖”(deadlock)的問(wèn)題的風(fēng)險,但其他的模擬器都會(huì )把這些問(wèn)題遺漏掉。所謂的“死鎖”是這樣的一種情況:許多核正在等待被其他核使用的資源(通信渠道或內存地址),但沒(méi)有核會(huì )放棄這種資源直到它被允許使用它需要的那個(gè),因此時(shí)鐘周期會(huì )一直記錄不到任何核做任何事情的信息。按照李哲明的說(shuō)法,“大黃蜂”正是為了補充以往方法的不足,而非與它們競爭。
除了能識別“死鎖”的風(fēng)險,研究人員也提出了一種能避免“死鎖”的方法,證明了“大黃蜂”在硬件系統上的優(yōu)勢:它可以輕松被重新配置以檢驗替代性的設計方案。愛(ài)德華·蘇(Edward Suh)是康奈爾大學(xué)電力和計算機工程的副教授,他表示,構建運行在硬件上的模擬器“要比只編寫(xiě)軟件棘手的多”,在“快速精準檢驗幾種方案”方面,“大黃蜂”占有優(yōu)勢。并且,如果要發(fā)現一些異常行為,該軟件無(wú)疑是非常有用的。
在第五屆“芯片上的網(wǎng)絡(luò )”國際研討會(huì )上,該研究小組獲得了“最佳論文”獎。研究人員將很快展示“大黃蜂”的新版本,新版本會(huì )考慮能量消耗的因素,也會(huì )將核與核之間的通信模式考慮在內,同時(shí)也會(huì )考慮個(gè)別任務(wù)的處理時(shí)間和內存訪(fǎng)問(wèn)的模式。
評論