<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 專(zhuān)題 > 高端處理器芯片的技術(shù)趨勢與可持續發(fā)展

高端處理器芯片的技術(shù)趨勢與可持續發(fā)展

作者:唐志敏 時(shí)間:2017-03-29 來(lái)源:電子產(chǎn)品世界 收藏
編者按:本文介紹了高端處理器芯片的市場(chǎng)需求,分析了當下所面臨的挑戰和機遇,以及處理器架構的發(fā)展和未來(lái)方向。

作者/ 唐志敏 中科院計算技術(shù)研究所

本文引用地址:http://dyxdggzs.com/article/201703/345935.htm

摘要:本文介紹了芯片的市場(chǎng)需求,分析了當下所面臨的挑戰和機遇,以及處理器架構的發(fā)展和未來(lái)方向。

  隨著(zhù)集成電路工藝的不斷提升,如今,逼近極限的集成電路工藝大大增加了高端芯片本身的研發(fā)成本。同時(shí),從整個(gè)傳感器網(wǎng)絡(luò )到云數據中心的新應用模式對計算機系統提出了很多新的要求。要應對這種新局面,就需要通過(guò)深入理解應用的本質(zhì)需求,設計可持續發(fā)展的結構。

芯片需要高性?xún)r(jià)比和低能耗

  目前的市場(chǎng)對主要有兩方面需求。

  第一方面就是要有較好的性?xún)r(jià)比。就當下市場(chǎng)來(lái)看,不斷降低成本的需求仍然存在,但是也出現了成本增長(cháng)的新因素。對很多應用來(lái)說(shuō),性能不再是最核心的瓶頸,用戶(hù)體驗成為新的關(guān)注點(diǎn)。例如現在的交通系統,已經(jīng)有汽車(chē)、火車(chē)和飛機,雖然更快一些會(huì )更好,但已經(jīng)不是整個(gè)系統競爭力提升的決定因素,更多在于用戶(hù)體驗和競爭力方面的考量。隨之而來(lái)的是性能本身也出現了一些新的形式,傳統意義上的計算速度和事務(wù)處理速度已經(jīng)不能體現系統的整體性能,現在還要加入服務(wù)速度,即單位時(shí)間內服務(wù)的請求數。

  另一方面則是低能耗。從需求方面來(lái)說(shuō),低能耗已經(jīng)成為一種新的趨勢。如今,已經(jīng)出現兩極分化,即云端和終端。云端規模太大,散熱和耗電都會(huì )成為很大的負擔,因而數據中心的利用率成為關(guān)注點(diǎn)。對終端方面來(lái)說(shuō),電池壽命是主要限制,待機時(shí)間成為關(guān)鍵影響因素。

  實(shí)際上,更多的能耗不是在計算方面,而是在通訊方面。一項研究表明,在一項Linpack計算中發(fā)現,平均每個(gè)浮點(diǎn)運算在FPU里消耗10pJ能量,而在訪(fǎng)存通路上耗能475pJ。因而,計算本身消耗的能量并不多,在訪(fǎng)存路徑中消耗的能量反而更多。在物聯(lián)網(wǎng)、傳感器領(lǐng)域中,很多數據傳送依賴(lài)于無(wú)線(xiàn)通信,這將使計算和無(wú)線(xiàn)射頻通信消耗的能量差距更大。

通過(guò)新結構和新算法解決低功耗

  為了解決能耗方面的問(wèn)題,我們除了有效利用訪(fǎng)問(wèn)的局部性,采用多級緩存外,還有很多其他方法。

  需求的變化使得計算系統的結構也會(huì )有相應變化,眾核并行結構是當下降低能耗的一種新結構。同時(shí),要求軟件棧采用扁平化結構,即軟件棧不要太深,因為軟件棧的不同層次之間,都是數據拷貝和傳送,軟件棧越深,耗電就會(huì )越多。另外,面向應用特性也可以做一些定制結構。

  探索提高新興應用性能的結構也是降低功耗的一種解決方法。例如,現在比較熱門(mén)的人工智能,面向人工智能方面的應用有一些新的結構,例如加速方案,比用傳統的通用處理方案效果更好。

  適應新需求的新算法是解決低功耗的另一種嘗試方法。算法復雜度的研究已經(jīng)很多了,傳統上人們只考慮算法的計算復雜度,而現在還需要考慮訪(fǎng)存復雜度和通信復雜度。傳統上會(huì )認為計算量越少越好,現在可能會(huì )考慮“計算多一點(diǎn),通信少一點(diǎn)”,以計算的增長(cháng)為代價(jià)換取通信的減少,更能節省能耗。

制約新結構產(chǎn)生的因素

  有兩個(gè)重要因素制約了對新結構的探索,即已有的軟硬件生態(tài)系統和開(kāi)發(fā)成本?,F存的大量工業(yè)標準和事實(shí)標準構成了成熟的軟硬件的生態(tài)系統,一旦新的結構不適應這種軟件生態(tài),就很難生存下去,而重新開(kāi)發(fā)一個(gè)新的生態(tài),比開(kāi)發(fā)一種新結構更為困難。這在很大程度上制約了開(kāi)發(fā)者對新結構的探索。而開(kāi)發(fā)新結構的成本也會(huì )很高,一個(gè)新結構需要一個(gè)新的芯片支撐,現在的極限工藝條件下,一次性工程開(kāi)發(fā)的投入越來(lái)越高,開(kāi)發(fā)一款新的芯片投入已經(jīng)在億美元的量級上。據IDC服務(wù)器市場(chǎng)架構分析,在2015年第一季度,X86服務(wù)器系統占整個(gè)市場(chǎng)99.26%份額,非X86系統只占0.74%。而在非X86市場(chǎng)中power占比較大,還有其他的EPIC、Sparc、CISC以及RISC等,如圖1。

突破指令集的禁錮

  是一把雙刃劍。由于兼容性好,指令集不變,軟件就不用改。壞處就是制約了技術(shù)本身的創(chuàng )新,積累的大量軟件成為體系結構革新的包袱。以X86為例,其條件碼會(huì )影響流水線(xiàn)效率,變長(cháng)指令則會(huì )影響指令譯碼和發(fā)射效率,復雜指令也會(huì )影響指令執行效率。

  由于當下市場(chǎng)的商業(yè)價(jià)值高于技術(shù)革新,舊的指令集的商業(yè)價(jià)值戰勝了技術(shù)革新的很多方面。在技術(shù)上,RISC比CISC好,而現在在市場(chǎng)上卻越來(lái)越少了,基本上只剩下一個(gè)ARM;之前有一個(gè)EPIC看起來(lái)也比CISC好,現在也已經(jīng)推出歷史舞臺。這是一個(gè)商業(yè)和技術(shù)博弈的結果,相對于技術(shù),商業(yè)起著(zhù)更重要的作用。

  與主流的指令集的兼容是比較重要的,因為要利用已有的軟性生態(tài)。即使是傳統的指令集其實(shí)也是一直在不斷地與時(shí)俱進(jìn),根據新的應用需求不斷發(fā)展的。以X86(傳統的指令集)來(lái)說(shuō),從最早70年代末,80年代初就有了,但是一直在不斷地擴展,增加了SIMD多媒體、SIMD向量計算,支持虛擬化、加解密運算,各種安全保護機制不斷地發(fā)展。

  另一方面,結構仍有不斷創(chuàng )新的空間。隨著(zhù)Internet的發(fā)展,出現了很多跨平臺的語(yǔ)言,例如JAVA等語(yǔ)言,對ISA(指令集平臺)的依賴(lài)性相對較小。

通用結構和專(zhuān)用結構

  物聯(lián)網(wǎng)是一個(gè)巨大的市場(chǎng),但是物聯(lián)網(wǎng)的需求是非常碎片化的。因而,物聯(lián)網(wǎng)的市場(chǎng)雖然非常大,但是不可能有一種架構包涵天下,可能有多種不同的架構,而每個(gè)架構/產(chǎn)品形式的量不一定那么大。

  從學(xué)術(shù)角度/技術(shù)角度來(lái)看,通用結構是樣樣都能做,通用計算機是適用于科學(xué)與工程計算、數據處理、事務(wù)處理、過(guò)程控制等各種應用,可高效率地運行SPEC CPU基準程序或包括其它各類(lèi)應用負荷特征的基準程序。專(zhuān)用結構是針對某類(lèi)算法而設計的,是從算法到架構映射出的特定結構,例如神經(jīng)網(wǎng)絡(luò )、流處理器等。包括現在的GPU,雖然在圖形方面比較通用一些,但是在計算方面還是有一定的專(zhuān)用性。

  通用結構的優(yōu)勢在于可以基于最先進(jìn)的工藝來(lái)做,穩定可靠,成本相對較低,有成熟的生態(tài)系統和解決方案,可以大批量生產(chǎn)。但是通用結構對許多應用并不是最優(yōu)的,它適合所用的應用,但只是對各種應用都不會(huì )太差。因而會(huì )導致資源過(guò)度浪費、延遲增大、能耗增加等因素。例如從云計算來(lái)看,一個(gè)通用的CPU中只有30%的面積是經(jīng)常用到的。

  專(zhuān)用結構針對應用算法進(jìn)行了優(yōu)化設計,效率高、省資源、能耗低。專(zhuān)用架構要開(kāi)發(fā)者自己做,增加了大量的設計和驗證工作,上市時(shí)間不確定,穩定性和可靠性也可能有問(wèn)題。由于巨大的NRE(Non-Recurring Engineering,一次性工程費用)難以被小批量產(chǎn)品所分攤,成本也會(huì )較高。

未來(lái)處理器架構

  未來(lái)的通用處理器的設計空間是跨越通用和專(zhuān)用的鴻溝,實(shí)現通用、高效、低功耗、低成本的處理芯片??梢杂么罅亢?jiǎn)單的核代替少量復雜的核,這樣雖然會(huì )降低能耗,但是比較專(zhuān)用;增加動(dòng)態(tài)特性,每個(gè)核支持多個(gè)硬件線(xiàn)程,片上能夠容納大量的線(xiàn)程進(jìn)行運算,這對開(kāi)發(fā)并行性,容忍訪(fǎng)存延遲有好處;另外,通過(guò)一個(gè)核上有多個(gè)線(xiàn)程,多個(gè)核上有更多線(xiàn)程,用動(dòng)態(tài)方式調度核內、核間線(xiàn)程,這樣的結構會(huì )更通用。就需求來(lái)看,終極目標是開(kāi)發(fā)一種普適的架構,同時(shí)支持數據并行和線(xiàn)性并行,可以滿(mǎn)足從云到端的各類(lèi)數據需求,包括云計算、服務(wù)器及移動(dòng)終端。

  (注:本文根據“2016中國集成電路產(chǎn)業(yè)促進(jìn)大會(huì )”的高端芯片發(fā)展論壇中演講改編。)

  參考文獻:

  [1]王瑩,葉雷.2015:物聯(lián)網(wǎng)引領(lǐng)芯片廠(chǎng)商創(chuàng )新[J].電子產(chǎn)品世界,2015(1):11-19.

  [2]迎九.用芯片開(kāi)啟產(chǎn)業(yè)物聯(lián)網(wǎng)的產(chǎn)業(yè)升級[J].電子產(chǎn)品世界,2015(9):1-3.

  [3]迎九.FD-SOI與FinFET互補,是中國芯片業(yè)彎道超車(chē)機會(huì )[J].電子產(chǎn)品世界,2016(4):5-6.

  [4]Peter Greenhalgh.ARM的A/R/M設計目標:適合的處理器來(lái)執行對應的任務(wù)[J].電子產(chǎn)品世界,2016(8):30-33.


  本文來(lái)源于《電子產(chǎn)品世界》2017年第4期第27頁(yè),歡迎您寫(xiě)論文時(shí)引用,并注明出處。



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>