<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 業(yè)界動(dòng)態(tài) > AMD資助:新法讓CPU+GPU融合處理器性能暴增113%

AMD資助:新法讓CPU+GPU融合處理器性能暴增113%

—— 為研究提供資助的是美國國家科學(xué)基金會(huì )和AMD公司
作者: 時(shí)間:2012-02-10 來(lái)源:cnbeta 收藏

  北卡羅萊納州大學(xué)和公司的研究人員們最近找到了一種新方法,能夠讓 APU、Intel Sandy Bridge這種集CPU、GPU于一體的融合型獲得平均20%以上的性能提升,最多可翻一番還多。工程師們主要是利用了x86的一些獨特性質(zhì),比如說(shuō)數據預取和大容量緩存,從而在GPU上加速并行任務(wù)的執行。

本文引用地址:http://dyxdggzs.com/article/128792.htm

  研究論文作者之一、電子與計算機工程副教授周惠陽(yáng)博士(Dr. Huiyang Zhou)認為:“芯片廠(chǎng)商開(kāi)發(fā)了 ‘融合架構’的,將CPU、GPU整合在單獨一顆芯片上。這種方法降低了制造成本,讓計算機更加高效,但是CPU核心、GPU核心仍然都幾乎完全在 執行各自不同的功能,很少能夠合作執行任何程序,因此沒(méi)有預想得那么高效。這就是我們要爭取解決的問(wèn)題。”

  他進(jìn)一步解釋說(shuō):“我們的方法是讓GPU核心去執行計算型功能,同時(shí)讓CPU從片外主內存中預取GPU所需要的數據。這樣做的效率更高,因為它能讓CPU、GPU去做各自擅長(cháng)的事情:GPU的長(cháng)項是進(jìn)行計算,CPU則適合做出決定、彈性獲取數據。”

  其實(shí)CPU、GPU從主內存中獲取數據的速度是差不多的,但如果能讓CPU來(lái)提前判斷GPU所需數據,并拿來(lái)做好準備,GPU就可以減輕負擔,全身心投入到執行和計算中去了,效率自然可以得到提升。

  在一個(gè)由CPU輔助進(jìn)行的GPGPU處理器中,CPU啟動(dòng)一個(gè)GPU程序后,會(huì )創(chuàng )建一個(gè)預執行程序。該程序使用編譯器算法從GPU內核中自動(dòng)生成,包含 GPU內核多個(gè)線(xiàn)程塊的內存訪(fǎng)問(wèn)指令。CPU預執行程序會(huì )在GPU內核之前運行,這是因為:第一,CPU預執行線(xiàn)程僅包含來(lái)自GPU內核的內存拾取指令, 沒(méi)有浮點(diǎn)計算;第二,相比于GPU標量核心,CPU的運行頻率更高,指令級的并行度也更高。

  研究人員們還利用了CPU二級緩存的預取能力,來(lái)提高CPU的內存帶寬,因此GPU線(xiàn)程訪(fǎng)問(wèn)內存對三級緩存的依賴(lài)及其延遲都大為降低。

  此外,因為預執行程序是直接由用戶(hù)級的應用程序控制的,精度和彈性都非常高。

  工程師們通過(guò)對一系列基準測試進(jìn)行試驗,最后得出結論稱(chēng)這種方法可將處理器性能平均提升21.4%,最多可達驚人的113%。

  這篇名為《CPU-GPU融合架構上的CPU輔助GPGPU》(CPU-Assisted GPGPU on Fused CPU-GPU Architectures)的論文將于二月底在新奧爾良舉行的第18屆國際高性能計算機架構研討會(huì )上公布。該論文的作者還有北卡羅來(lái)納州大學(xué)的在校學(xué)生Yi Yang、Ping Xiang(看來(lái)都是華裔人士),以及來(lái)自公司的Mike Mantor,而為研究提供資助的是美國國家科學(xué)基金會(huì )和AMD公司。

  很顯然,AMD未來(lái)的Fusion APU非常有希望用到這些技術(shù)。



關(guān)鍵詞: AMD 處理器

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>