AMD四核處理器巴塞羅那的深度分析
——
四年以后,塵埃終于落定,AMD在其為工作站和服務(wù)器設計的四核CPU中首次實(shí)現了K10微架構。不出所料,首次發(fā)布的是2GHz和1.9GHz版產(chǎn)品,2.5G將在“11月推出”。
AMD想要戰勝I(mǎi)ntel的地方其實(shí)概括起來(lái)只有三個(gè)詞:
1. Front
2. Side
3. Bus
每一個(gè)核都可以單獨鐘控(AMD的術(shù)語(yǔ):獨立動(dòng)態(tài)核技術(shù))。每一個(gè)核都可以選擇性的將無(wú)需工作的部分進(jìn)行門(mén)控時(shí)鐘處理以節省功耗(Coolcore技術(shù))。核和內存控制器有兩個(gè)獨立的電源層(雙動(dòng)態(tài)電源管理)。
每個(gè)核專(zhuān)門(mén)配備128Kbytes的一級緩存,512Kbyte的二級緩存。四個(gè)核共享2Mbytes的三級緩存。
高效交叉開(kāi)關(guān)使得四核都可存取兩個(gè)72位寬的DDR2-667內存控制器,通過(guò)HyperTransport 2.0鏈路可以與其他CPU交互。
當比較AMD與Intel雙核和四核結構時(shí),我的重心在前端總線(xiàn)(FSB)上
。Intel CPU(還)不是單管芯的四核設計,相反,它們將兩個(gè)雙核堆疊在一個(gè)封裝中;它的管芯內不含有內存控制器,相反,DRAM控制器由獨立的核邏輯芯片組-北橋芯片提供;而且它們沒(méi)有專(zhuān)用的CPU間互連通道(至少一年內不會(huì )有)。 這一切意味著(zhù)Intel用來(lái)連接管芯與管芯之間,CPU與CPU之間以及CPU與芯片組之間的FSB會(huì )承載很多對時(shí)序敏感的關(guān)鍵數據。表面上看,這些特性會(huì )讓Intel處于劣勢,但是,考慮以下幾點(diǎn):
Xeon CPU的每一個(gè)雙核管芯都有兩個(gè)64Kbyte的一級緩存陣列(一對一),再加上4Mbyte的共享二級緩存,沒(méi)有三級緩存。與巴塞羅那比較一下緩存的大小和類(lèi)型,特別是一級對一級,二級對二級(注意一級緩存性能通常優(yōu)于二級,二級快于三級)。
Xeon5300系列FSB有1066MHz和1333MHz兩種,而至今Xeon 7300系列只提供了1066MHz的FSB。AMD最新四核Opteron產(chǎn)品線(xiàn)和之前基于K8微結構的雙核處理器還另有兩個(gè)特征:
芯片的虛擬化支持經(jīng)擴展后包含有硬件的虛擬-物理地址轉換加速器,而之前是速度較慢的軟件轉換;
AMD加強了每個(gè)核的浮點(diǎn)能力,從單指令64比特的FPU升級為雙指令128bit的FPU。
首先看虛擬化,注意AMD用先前的3GHz雙核CPU與2GHz的四核進(jìn)行benchmark對比。雖然這并不反映芯片或制程的一個(gè)基本問(wèn)題,但它還是反映出AMD期望四核的后續產(chǎn)品不僅能夠從芯片的管腳角度還可以從功耗和熱輻射方面做到直接替代。不考慮時(shí)鐘速度的不同,考慮到新的芯片具有增強的虛擬化硬件異常分支指令和兩倍的CPU核數量,在這樣的條件下79%的虛擬化性能提升并不算出人意料。
Intel有NetBurst-to-Core微架構,AMD也試圖改善功耗,但目前我還沒(méi)有ACP的對比數據。在比較AMD與Intel的功耗時(shí),要記得Opteron內含DRAM控制器,而Intel的Xeon沒(méi)有。AMD也繼續使用DDR2 SDRAM,而Intel采用Rambus-reminiscent串行接口方案FB-DIMM。有報告稱(chēng)在系統空閑或低負荷時(shí),FB-DIMM比DDR2 SDRAM功耗高,而在系統高負荷時(shí),FB-DIMM在每瓦性能和總功耗方面比較有吸引力。
對比一下AMD先后送給我的兩個(gè)文檔可以有以下發(fā)現:
AMD也玩Intel和其OEM伙伴Apple之間的“速度”游戲。"_rate"版的SPECint (整數)和SPECfp (浮點(diǎn))按照系統中的CPU數目并行跑多個(gè)Benchmark程序,在A(yíng)MD與AMD的SPECint比較中,雖然四核CPU主頻有33%的降低,但四核是雙核核心的雙倍,所以50%的性能提升是再正常不過(guò)的。
AMD沒(méi)有就SPECint做與Intel的比較,重心相應放在了SPECfp和其它浮點(diǎn)相關(guān)的測試。這反應出AMD在K8向K10的演進(jìn)中將重心部分放在了每核的FPU上。
不出所料AMD做了很多核到核、CPU到CPU以及CPU到內存的Benchmark測試,以此來(lái)對比競爭對手Intel的共享FSB。
在其中一份文檔中AMD做了其高端2GHz CPU與Intel 2.33GHz處理器的Benchmark對比,注意這款I(lǐng)ntel產(chǎn)品并不是Xeon 53xx系列最高端的產(chǎn)品。
有些人已經(jīng)拿到了基于四核Opteron的系統,雖然簡(jiǎn)短的測試不能說(shuō)明什么問(wèn)題,我還是在一些測評中發(fā)現了些問(wèn)題:
四核可相互利用對方二級緩存和共享三級緩存在目前的測試中并沒(méi)有比需要FSB交互的Intel Xeon系列在性能上有明顯優(yōu)勢。部分上這與AMD三級緩存太長(cháng)導致的延時(shí)有關(guān)。Intel的總緩存帶寬好像也超過(guò)了AMD的三級緩存方案。
Intel在整型數性能上似乎還保有優(yōu)勢,同時(shí),AMD加強的FPU在浮點(diǎn)數性能上也沒(méi)有達到我和其他人的預期;
AMD不再依賴(lài)共享的FSB,交叉開(kāi)關(guān)模式和集成的DRAM控制器以及低延時(shí)(與FB-DIMM)的DDR2 SDRAM的使用都使得Opteron在“流”類(lèi)型數據處理上很有優(yōu)勢,因為它們需要不斷讀取系統主內存。
AMD值得懷疑的四核Opteron性能,加上其競爭性的定價(jià),這都是我長(cháng)久以來(lái)對AMD長(cháng)期財務(wù)健康擔心的緣由。
在Intel的大幅降價(jià)下,我想AMD會(huì )占據中等的市場(chǎng)規模。理想情況下,新結構的發(fā)布都會(huì )有一個(gè)較高的定價(jià),代表著(zhù)新芯片的附加值和其前期的低產(chǎn)量。但不幸的是,同Intel已經(jīng)推出9個(gè)月的CPU相比,AMD沒(méi)能提升價(jià)格,這樣的話(huà)四核可以盈利嗎?
現在我對AMD接下來(lái)幾個(gè)月的舉動(dòng)比較感興趣:
AMD會(huì )以怎樣的速度開(kāi)始2GHz產(chǎn)品的鋪貨;
AMD多久可以推出2. 5G以及更高速率的產(chǎn)品;
還會(huì )有哪些深層的測試;
AMD多久可以推出針對消費類(lèi)市場(chǎng)的k10微架構
評論