熱門(mén)芯片亮點(diǎn)
別讓芯片過(guò)熱
8月14~16日,在stanford大學(xué)召開(kāi)的為期三天的第17屆熱門(mén)芯片展(hot chips 17)落下了帷幕?;仡櫛緦谜褂[,展品范圍廣泛,從科研前沿到流行商用芯片應有盡有,本文很難面面俱到(可瀏覽www. hotchips.org/hc17),僅就當前的亮點(diǎn)作一概覽。
今年的熱門(mén)芯片展上展出了ibm的游戲機控制臺,并進(jìn)一步披露cell處理器的結構,微軟談了xbox360系統的某些的細節,toshiba介紹了為playstation 3配套的超級i/o芯片,還有ibm關(guān)于其寄存器的數據操作細節、器件連接總線(xiàn)和編程模塊等展項。
會(huì )展程序的安排反映了當前研發(fā)的主體,正轉向可配置邏輯和渾然不于傳統馮尼曼主流結構的處理器。telairity, philips, cradle和tensilica (軟核ip)等公司研制出各有自己獨特解決方法的媒體處理器。
在前沿技術(shù)方面,luxtera令聽(tīng)眾第一次窺見(jiàn)用調制激光所生產(chǎn)的硅片結構。環(huán)形調制器生成的半徑為30_m的硅結構準備用于生產(chǎn)可微調的光學(xué)濾波器。
另一個(gè)非??岬男录夹g(shù)是用超導和josephson結研制的40ghz的高頻邏輯開(kāi)關(guān),用于控制無(wú)損耗超導中傳送的量子脈沖信號。其極終目標是要制造超帶寬的微型控制器件。雖然這項技術(shù)今天還正在開(kāi)發(fā)之中,但是感到美中不足的是,為保持超導所需的7k低溫,所需制冷設備太過(guò)笨重。
離不開(kāi)摩爾定律
intel技術(shù)與生產(chǎn)部總經(jīng)理bill holt回顧intel半導體技術(shù)發(fā)展的歷程時(shí)說(shuō),intel持續地保持著(zhù)大約每?jì)赡?a class="contentlabel" href="http://dyxdggzs.com/news/listbylabel/label/微電子">微電子技術(shù)前進(jìn)一個(gè)階梯的速度,印證了摩爾定律的正確。而且預計最近若干年內還會(huì )出現幾次這種微電子技術(shù)的階躍。
holt指出當前微電子的生產(chǎn)技術(shù)向多核結構轉移,其背后的秘密與降低硅片的功耗密度有關(guān)。雙核處理器使每個(gè)核的工作電壓與頻率降低,而管芯面積翻番。于是,原來(lái)集中在單核管芯的功耗不僅得以降低并且還被分散于倍增的面積之上。
改變特定電路的設計也能降低局部的熱力集中。將電路分成兩個(gè)半速的功能塊,可以降低每個(gè)功能塊的峰值功率,且將功耗分散于較大面積的管芯之上。代價(jià)是需用雙倍的晶體管和較大的管芯面積。如果使用90nm或更先進(jìn)的工藝,將大量的晶體管集成于相對較小硅面積的余地越大。
intel沒(méi)有走大力降低功能塊功率的道路,而是繞過(guò)去對時(shí)鐘電路加以控制??墒菍r(shí)鐘電路的控制并不能改變晶體管的靜態(tài)漏電流。為切斷漏電流需增加“睡眠”晶體管,像高速緩存器那樣集中地切斷大型晶體管的電源線(xiàn)和底線(xiàn)。但是它們的再次上電,需要增加一個(gè)以上的額外時(shí)鐘周期。holt說(shuō),這項技術(shù)已用于整塊的高速緩存。那里需要更多的時(shí)鐘周期,然而切斷電源的時(shí)間往往是數倍于此時(shí)間的。
增加額外時(shí)鐘周期的主要原因是因連線(xiàn)的rc延遲。改進(jìn)連線(xiàn)結構使電路靠得更近,改進(jìn)管芯集成策略將硅層3維疊置。這種將同樣的管芯上下疊置,可能是制造多核處理器和相應soc的更好更快的途徑。這種想法與sun公司的臨近連接的研究課題有些相近。
xbox360結構設計
微軟對即將面世的xbox360游戲控制臺系統作了進(jìn)一步介紹,并在一臺xbox360的開(kāi)發(fā)系統上進(jìn)行演示。微軟是在多核策略的基礎上構建xbox360的。微軟表示其設計目標:旨在向游戲程序的開(kāi)發(fā)者提供一個(gè)強大而價(jià)格又是可接受的平臺。功能強大的3核處理器是一個(gè)便于開(kāi)發(fā)的對稱(chēng)多處理器方案,微軟使用openmp實(shí)現線(xiàn)程api。3核處理器附有1mb的 l2 高速緩存和總數為1.65億只晶體管。
xbox360 有512mb統一的ddr3 dram 存儲器,連接到圖形處理單元(gpu) (見(jiàn)圖1)。它不同于sony的playstation 3 游戲站的設計。sony的設計中,存儲器是分散于多核處理器和gpu之間的。分散存儲器的好處是各有自己專(zhuān)用帶寬的存儲器,但缺點(diǎn)是封裝的引腳多、硅片集成度低、存儲器劃分固定和高價(jià)位。而統一存儲器的好處是,可以按需要在處理器之間重新劃分,但是,在設計xbox360時(shí)必須考慮到處理器與主存儲器之間的較長(cháng)延時(shí),應采取措施進(jìn)行補償。

圖1 xbox360框圖
xbox360使用了一種技術(shù)使每個(gè)cpu核的數據流只進(jìn)入自己的數據緩沖l1,避免多次出入高速緩存l2,攪亂那里的正常數據流 (見(jiàn)圖2)。每個(gè)cpu核處理結束后的流才送到3核共用的l2 。gpu使用ibm設計的高速點(diǎn)-點(diǎn)連接,直接從3核共用的l2取到正確的數據流。采用這樣的流數據編程模式,使程序員能以最少的讀和寫(xiě)數來(lái)節約存儲器的帶寬。

圖2 xbox360的3核cpu框圖。 每個(gè)cpu核模塊將圖形/文字的數據流送到l1 數據高速緩存,經(jīng)整理后再送入共用的1mb l2高速緩存。 gpu 直接從l2 獲得數據流,免除多余的對dram主存的讀/寫(xiě)所有cpu核所用的高速緩存的位寬為128b。 l2高速緩存具有靈活的指令集能對確定的指令與數據加鎖,如微軟設計的vmx simd單元有專(zhuān)門(mén)擴展的指令。它包括有點(diǎn)積和支持同gpu相共享的direct3d api 數據格式。今年10月由in-stat《微處理器報告》主辦的“秋季處理器論壇”上,對于xbox360 還會(huì )有進(jìn)一步的介紹。
ati所設計的gpu (見(jiàn)圖3)具有48個(gè)并行的工作于500mhz的統一分色器核。每個(gè)核均支持32位的ieee浮點(diǎn)運算。它是對每條指令都能進(jìn)行向量、標量、和紋理運算的超標量結構,每秒鐘能執行240億次分色器指令。其他可列出的峰值技術(shù)規范還有:全速時(shí)的每秒40億次的像素運算、每秒80億次的雙向線(xiàn)性采樣率、以及每秒5億次的有關(guān)于三角形的幾何運算。

圖3 xbox360 的圖像處理單元(gpu)框圖
著(zhù)眼于效率,cpu核可以工作于gpu的從機模式。為了及時(shí)提交3d圖像,必須使圖像跟上視頻刷新的時(shí)間要求,經(jīng)常需運行于最高優(yōu)先級,各cpu核應竭盡全力保證所提供的流水線(xiàn)能夠避免出現不自然的人為痕跡(如不完整的紋理組織)和屏幕更新的呆滯,總之,不允許干擾畫(huà)面的真實(shí)感和游戲的沉迷感。
xbox360芯片要在不同的90nm工廠(chǎng)生產(chǎn)。微軟希望以后能把管芯的尺寸縮小,并移植到下一代生產(chǎn)工藝的流水線(xiàn)上去生產(chǎn),從而降低游戲機控制臺的價(jià)格。
并非事必“多核”
盡管intel對于多核處理器和xbox360作過(guò)許多正面的宣傳,外界也有許多將多核處理器用于家用pc、游戲控制臺、和其它消費設備的多種設想,然而,也有一種聲音在說(shuō):皇帝沒(méi)穿衣服!對熱點(diǎn)芯片發(fā)表這樣基調的,有nvidia公司的主要科學(xué)家david kirk,他指出,今天尚缺乏能有效使用多核處理器的內容(如游戲的節目)!幾乎同時(shí),john carmack——id軟件公司的合伙創(chuàng )立人、技術(shù)主任和編程老鳥(niǎo),在一次有關(guān)計算機游戲的聚會(huì )時(shí)談到,用現行的軟件方法和工具要想使多線(xiàn)程游戲程序正確地工作是很困難的。還指出,對于pc,除去應用代碼問(wèn)題之外,驅動(dòng)程序也得改進(jìn)。一般來(lái)說(shuō),編寫(xiě)常規的串序執行程序,游戲程序的編程人員需要花費多年時(shí)間才能對一種處理器體現出優(yōu)化。將代碼拆分成多核執行的形式,又得重新進(jìn)行優(yōu)化,它們都需要時(shí)間和重新加以研究和探討。
多線(xiàn)程編碼的部分問(wèn)題還在于,現在最常用的語(yǔ)言對于揭示出并行性的能力很弱。kirk也相信,對此問(wèn)題,目前還沒(méi)有足夠的主流研究和教育部門(mén)的關(guān)注。超級計算機界的研究者和專(zhuān)業(yè)軟件界的編程者可能都不會(huì )同意這種多核的主張,因為尚無(wú)多線(xiàn)程方面的擴展研究;再者,多線(xiàn)程也未形成主流研究課題。誠然,多核pc和游戲控制臺將來(lái)會(huì )促使多線(xiàn)程編碼成為一個(gè)主流研究課題。
上述問(wèn)題會(huì )獲得解決的一個(gè)信號,是intel, microsoft, 和cell計算機的伙伴(ibm/sony) 提供了多核處理器的改良軟件工具。當程序人員學(xué)會(huì )如何有效使用多核技巧的時(shí)候,相信抱怨定會(huì )減少。(摘自美國microprocessor report,梁合慶譯)
評論