十問(wèn)Chris Rowen:聽(tīng)微處理器大師講SoC設計的前世今生
中國北京2010年6月11日訊–即便放眼整個(gè)IC行業(yè),像Chris Rowen博士這般愛(ài)談技術(shù),同時(shí)又可以講得如此深入淺出的,著(zhù)實(shí)少見(jiàn)。他可以一邊舉起手中的iPhone做各種演示,也可以拿起隨手拾見(jiàn)的小紙條寫(xiě)寫(xiě)畫(huà)畫(huà)來(lái)加強語(yǔ)氣。他咬字無(wú)比清晰準確(尤其在諸如Interestingly或者particularly這類(lèi)副詞的時(shí)候會(huì )讀得緩慢甚而產(chǎn)生了某種韻律感),似乎是在運用一種類(lèi)似于詩(shī)人誦詩(shī),抑或冒險家在眾人面前娓娓道來(lái)諸多奇跡的情緒和語(yǔ)氣,來(lái)描述那些SoC設計的理念。很神奇。
而更加奇妙的是,他幾乎經(jīng)歷過(guò)微處理器的所有起起伏,前世今生。他是RISC架構的奠基人之一,分別參與了Intel和MIPS公司的大躍進(jìn)時(shí)代,如今,又帶著(zhù)一種全新SoC架構的理念,在或多或少地改變著(zhù)我們的數字時(shí)代。所以,與其說(shuō)是采訪(fǎng),還不如說(shuō)是在聽(tīng)一個(gè)傳奇(而且這個(gè)傳奇也不過(guò)是翩翩中年哦?。┲v故事。
Power Density、Parallel、Multi-Core、FPGA、RISC、SoC,這些詞于談笑間輾轉騰挪,有一瞬間,我差點(diǎn)覺(jué)得對面坐著(zhù)的是 Wes Anderson,那個(gè)拍出過(guò)《了不起的狐貍爸爸》(Fantastic Mr. Fox)的我最中意的好萊塢導演。不避世也不趨世。獨辟蹊徑,信手拈來(lái)。關(guān)鍵都還挺帥的。
1、我看過(guò)您2004年寫(xiě)的“復雜SoC設計”,非常喜歡的第8章(Chris Rowen :“SOC設計的未來(lái)”哈哈)。恩您還記得。因為你的所有預言都應驗了,這非常有趣。所以我的問(wèn)題是,您如何看待再6年之后的SoC設計,或者說(shuō)和SoC 設計有關(guān)的那些技術(shù)趨勢? (Chris Rowen :哇,這個(gè)問(wèn)題還不賴(lài)?。?br />
Chris Rowen :我認為這個(gè)市場(chǎng)的大方向還是相當清楚的??纯词袌?chǎng)層面的基本趨勢,再看看技術(shù)層面的基本趨勢,你就可以看到他們在哪里重合。就技術(shù)而言,你會(huì )發(fā)現摩爾定律(Moore’s Law)作為經(jīng)濟驅動(dòng)力的事實(shí)。但是摩爾定律真正有趣的部分在于,第一,是“集成度(Density)持續提高”。每隔2年半或者3年,硅密度就要提高一倍,這意味著(zhù)近一倍成本的降低,讓射頻產(chǎn)品中的數字模塊集成度越來(lái)越高。這也意味著(zhù),各種系統都在規模(Scale)上變得越來(lái)越小。所以無(wú)論是電腦亦或消費電子設備,每一個(gè)系統的目的都是集成于同一塊芯片。這就變得有趣起來(lái)。因為在過(guò)去,你可以生產(chǎn)通用(Generic)存儲器,通用處理器,通用射頻,諸如此類(lèi),然后一股腦兒放在一塊兒,建一個(gè)非常牛逼的專(zhuān)用(Specific)系統。但是在今天,事情都顛過(guò)來(lái)了。你更希望把一坨不同的功能集合到一塊芯片上。當然在這個(gè)意義上,你還是得搞出一塊專(zhuān)用芯片。但是挑戰變大了,因為芯片本身需要更加專(zhuān)注于某一個(gè)特殊應用,而應用處理器、內部總線(xiàn)等等其他玩意兒,也要變得更小更強更快!
另一件吊詭的事就是,摩爾定律并沒(méi)有在晶體管層面帶來(lái)太多的功率改進(jìn)。在過(guò)去,當東西變小了,功率自然就降低了,所以工程師也壓根不需要操心什么芯片架構(Architecture)。而現在,如果工程師想要優(yōu)化功耗,首先就要優(yōu)化架構。他得考慮我怎么著(zhù)才能更有效地完成這個(gè)計算?譬如用更少的晶體管門(mén)或者運算周期,甚至在這個(gè)任務(wù)不運行的時(shí)候關(guān)閉掉相應子系統??傊?,這活兒變智能(Intelligent)了。
所以舉個(gè)例子啊,比如你想做個(gè)手機,就必須要注意區分不同的使用場(chǎng)景,譬如聽(tīng)音樂(lè )、看YouTube視頻、發(fā)短信、上網(wǎng),或者煲電話(huà),這些都是完全不同的情景。你得關(guān)掉所有沒(méi)用的子系統。更細心,更積極。因此對于芯片設計師(Chip Architect)或者系統設計師來(lái)說(shuō),這是最好的時(shí)代。因為有這么多的事兒可做。但對于一個(gè)晶體管工人(Transistor Guy)而言,這可真是最壞的時(shí)代??!一切都已經(jīng)上升,已經(jīng)上升到系統或者應用的級別。這就是技術(shù)領(lǐng)域正在發(fā)生的大事件。
2、未來(lái)幾年市場(chǎng)方面的變化呢?
Chris Rowen :說(shuō)到市場(chǎng)。我認為最大的趨勢是一切都已經(jīng)移動(dòng)起來(lái),因為人們的生活方式已經(jīng)徹底改變了。當你可以隨身攜帶那么多的設備,就會(huì )希望能夠持續地連接到互聯(lián)網(wǎng) 上。這種影響不僅表現在設備上,還表現在無(wú)線(xiàn)基礎設施,以及云計算上。而且經(jīng)濟層面的機會(huì ),將會(huì )隨之變得非常,非常深遠。因為你會(huì )看到,譬如在這種設備 (Chris拿起手里的iPhone開(kāi)始演示)的層面,無(wú)線(xiàn)連接的帶寬起碼還要提高30倍。為了獲得足夠豐富的娛樂(lè )體驗,我們或許需要幾十甚至幾百兆比特 的帶寬。在世界每一個(gè)地區,高端用戶(hù)越來(lái)越多。中國就是一個(gè)鮮活的例子。不光如此。在印度、南美、非洲、加勒比海地區,人人都希望持續不斷地連接到互聯(lián)網(wǎng)。
所以,你必須很好地設定人們日益增長(cháng)的期望值?,F在有10倍的寬帶人口增長(cháng)每個(gè)人都有30倍的寬帶需求,因此就有了300倍的寬帶要求。而系統的每個(gè)層面都需要滿(mǎn)足這種需求。對于無(wú)線(xiàn)基礎設施制造商來(lái)說(shuō),他們的機會(huì )是巨大的。譬如華為。但是制造商是沒(méi)可能贏(yíng)得300倍收入的。有可能獲得更多的收入, 但不是三百倍以上。因此,他們必須在得到大幅增加帶寬的同時(shí),大幅降低資金成本(Capital Cost)和經(jīng)營(yíng)成本(Operate Cost)。
3、那么接下來(lái)在SoC設計上會(huì )有什么事情發(fā)生?
Chris Rowen :你可以看下無(wú)線(xiàn)基站作為例子。傳統意義而言,它們是昂貴的。你可以找些通用芯片、通用DSP、通用FPGA??墒墙裉?,為了滿(mǎn)足對帶寬的要求,您需要更 多的高度定制的SOC,芯片平臺和軟件的需求也上升很快。所以這將使集成度更高,每塊芯片上集成更多的DSP,而每塊DSP上嵌入更多的軟件程序,甚至是 軟件內容的爆炸性發(fā)展。
有趣的是,每部分網(wǎng)絡(luò )基礎設施(Network Infrastructure)的功耗都是巨大的。那么即便為綠色節能考慮,減少為更加緊密集成的系統都是異常重要的?;緦⒚黠@變小,這意味著(zhù)整個(gè)基站 都可變成塔頂的一個(gè)小盒子,而不是……裝在塔頂可是簡(jiǎn)單很多。
當然在系統層面,你一旦降低成本以后降低功耗也就水到渠成。所以這兩者之間是一個(gè)非常良性的關(guān)系。關(guān)鍵是硅晶圓的集成。這也是Tensilica會(huì ) 如此迅速成長(cháng)成為世界領(lǐng)先的DSP內核供應商之一的原因。
甚至可以看到這種變化體現到了云計算上。因為現在你需要300倍的帶寬,也就相應地對視頻服務(wù)、視頻壓縮、互聯(lián)網(wǎng)數據庫搜索、社會(huì )網(wǎng)絡(luò ),如此等等, 都提出了更高的需求。而所有這些事情,真的都是很復雜的應用程序呢。
不過(guò)有趣的是,他們都是些并行的應用程序。這是個(gè)好消息。因為在計算機業(yè)已經(jīng)發(fā)生的一件事情便是,單個(gè)微處理器的速度已經(jīng)很難再提高了。Intel 在1990年,戲劇性地發(fā)現了單處理器性能呈指數增長(cháng)的改善。但是他們也旋即發(fā)現當處理器頻率達到約3.5到4GHz的時(shí)候,功率密度(Power Density)遇到了瓶頸。于是,他們開(kāi)始嘗試多核技術(shù)。
還好人民群眾想做的事,基本都是天然就可以并行處理的。所以,你在做互聯(lián)網(wǎng)數據庫檢索(Internet Database Search)的時(shí)候,確實(shí)可以設置多內核、多芯片,甚至多系統。因為你的查詢(xún)請求通常將被發(fā)往多個(gè)地點(diǎn)。所以在互聯(lián)網(wǎng)云計算的領(lǐng)域,運用多核的機會(huì )無(wú)比 廣闊。
而且確實(shí)存在是一個(gè)問(wèn)題,就是你如何在有效的MIPS指令內獲得足夠低的功耗?;蛘哒f(shuō),如何在設計電池壽命最長(cháng)的移動(dòng)設備,和最可擴展的服務(wù)器之間 取得關(guān)聯(lián)?因為所有都和功耗有關(guān),而非峰值的性能。
4、那么Tensilica是如何來(lái)克服在功耗上的挑戰的?和競爭對手比起來(lái)又有何區別?
Chris Rowen :舉個(gè)例子。Tensilica贊同為特定的任務(wù)去優(yōu)化處理器。優(yōu)化流水線(xiàn)(Pipeline),優(yōu)化接口,優(yōu)化設計層面,然后把多個(gè)內核放在一起,以建 立一個(gè)多核系統。這種優(yōu)化的能力將產(chǎn)生巨大的影響。我會(huì )在今天下午的會(huì )上談到這個(gè)稱(chēng)作Turbo解碼器的專(zhuān)用(Specialized)處理器。 Turbo是一種特殊的算法,可以從嘈雜的噪聲中提取有用信息,在一個(gè)工作循環(huán)(cycle)內,這個(gè)解碼器可以執行大約3萬(wàn)次,哦對的沒(méi)錯3萬(wàn)次 RISK指令。是的,通用的壓縮(Compression)處理器只能執行一次指令,而這個(gè)專(zhuān)用處理器可以執行3萬(wàn)次。當然這是一個(gè)極端的例子,只是想表明當你知道你的問(wèn)題在哪里,你就可以做出很多令人難以置信的事情。并行,并因此難以置信的高效率。
同樣的原則可以適用于各個(gè)層面,適用于各種其他門(mén)類(lèi)的專(zhuān)用DSP、無(wú)線(xiàn)接收器,適用于基帶和音頻的通用DSP,也適用于客戶(hù)意欲進(jìn)行視頻處理或其他 圖形壓縮、安全操作、網(wǎng)絡(luò )協(xié)議處理,以及廣泛應用于射頻的深嵌入式控制(Deeply Embedded Control)。
Tensilica特別集中精力于那些能夠專(zhuān)門(mén)優(yōu)化的能力,以及真正方便使用多核的能力。而因此,我們從那些傳統的CPU老家伙們中區別了出來(lái)。譬如Intel、ARM、MIPS,或者其他什么人。他們都面臨一個(gè)相同的物理問(wèn)題,摩爾定律在給了他們更多的晶體管之后,卻沒(méi)有給他們更好的功率控制,對 不對?
他們很少去考慮并行的問(wèn)題。而與之相反,我們在應用層面非常努力地工作,以期尋找到解決方案。在云計算那段,我們確實(shí)可以將任務(wù)分割成很多子任務(wù),但是當我在這里玩游戲(Chris又一次拿起手里iPhone開(kāi)始演示),我真的被限制了。你看,一個(gè)手指只能玩一樣東西哈。因此在應用處理器的層面,你 真的無(wú)法得到啥好處。MIPS、ARM,甚至還有Intel,都面對著(zhù)這樣一個(gè)無(wú)法在當前硅科技下有效完成多任務(wù)的問(wèn)題。而那是我們擅長(cháng)的。
我們看到這個(gè)市場(chǎng)在迅速增長(cháng),去年的出貨量增長(cháng)了大約70%。然后我們會(huì )試圖進(jìn)入所有的DPP(Data-Plane Processor)領(lǐng)域,包括DSP、音頻視頻、安全,以及深嵌入式控制,這其實(shí)和應用處理器的范疇離得很遠。所以啊,我們常常會(huì )發(fā)現自己和MIPS、 ARM或Intel出現在同一塊芯片上。你知道吧,其實(shí)我們就是工廠(chǎng)的工人?。–hris突然哈哈大笑)!因為有這么多不同的處理器,在Date- Plane里又有這么多不同的任務(wù),那些小而高效的處理器會(huì )有很多機會(huì ),很多接口(Socket)。
這種對于應用處理器或者接口的互補性,甚至于可以讓?xiě)锰幚砥髟趫绦蓄?lèi)似于信號處理這種實(shí)時(shí)任務(wù)的時(shí)候,也完全關(guān)閉?;蛘弑热缍嗝襟w應用,應用處理器當然可以去做,但是如果我們優(yōu)化專(zhuān)用音頻DSP的話(huà),將獲得4到5倍的效率。尺寸更小,單位時(shí)間內的吞吐量卻更大。而且可以用如此多的音視頻處理器夠你 選擇。所以幾乎任何時(shí)刻,系統設計師或者SoC設計師都可以通過(guò)區別應用場(chǎng)景的方式,來(lái)決定卸載(Off Load)哪個(gè)處理器。
這也是為什么我認為我們可以在音頻方面取得這么大的成功。當你正在設計一個(gè)手機,或者閱讀顯示器,或者機頂盒,或者數字電視,或者數碼相機,你會(huì ) 說(shuō),啊,這里有一種場(chǎng)景需要我做大量音頻的工作。于是,把那種卸載很自然地就被設計到基本構架里去了。
而且,我們可以為應用層面的處理器自動(dòng)生成軟硬件,尤其是基于音頻和基帶的非常全面的軟件庫(Software Libraries)。因此,不管是老手還是菜鳥(niǎo),在我們的店鋪里都能找到他們所有需要的軟硬件解決方案,以幫助他們最快地進(jìn)入市場(chǎng)。集成音頻、集成基 帶,或者其他各種功能。
5、那么Tensilica有什么具體的應用嗎?
Chris Rowen :今天下午,我將討論一下移動(dòng)電話(huà)。這是一個(gè)巨大的市場(chǎng),一個(gè)可以滿(mǎn)足之前所說(shuō)帶寬需求的市場(chǎng)。特別是從當前正從3G向4G升級,大家都聚焦在LTE身 上。不僅因為L(cháng)TE看上去很像是最后標準的勝者,也因為它非常像WiMax。我們已經(jīng)能夠提供參考設計,幫助客戶(hù)建立他們自己定義的多核LTE手機,在市 場(chǎng)中搶得先機。這只是一個(gè)我們進(jìn)入領(lǐng)域的實(shí)例。
我們也在做一個(gè)很類(lèi)似的數字電視解調器。因為有人希望既為移動(dòng)應用又為起居室設計一種通用的數字電視接收器。這里有個(gè)很大的問(wèn)題,就是全世界在視頻 領(lǐng)域有好多不同的標準和概念,而每個(gè)人都真心希望擁有一塊可以解決一切的視頻芯片。我們準備來(lái)設計一塊。其實(shí)應用一樣的原理,就是找些DSP和專(zhuān)用核,優(yōu) 化最密集的任務(wù),并充分利用我們最重要的能力——生成處理器的功率效率非常小,以及和世上最穩定的通用DSP一樣易于編程的軟件工具。昨天晚上客戶(hù)還和我 們說(shuō),DSP如此招人待見(jiàn)的最主要原因就是可編程。譬如TI的那些DSP。我們同樣在努力使編譯器更強大,使程序模型簡(jiǎn)單,使程序員更不操心。我們還微處理器的流水線(xiàn)設計上增強了視覺(jué)效果。這種架構下要還能生成不正確的代碼,也怪難的。
因此,我們擁有一個(gè)非常高效的處理器。但是效率(Efficiency)這個(gè)詞值得商榷。傳統意義上而言,效率就是指最少的門(mén)數、最小的功耗,巴拉 巴拉。但效率也是將產(chǎn)品推向市場(chǎng)的時(shí)間。需要多少工程師才能部署好這個(gè)系統?每行代碼的成本是多少?每個(gè)工程師小時(shí)(Engineer Hour)所能帶來(lái)的收入?除了硅片層面的效率以外,這些同樣是測量效率的重要參數。我認為我們在這兩面都推動(dòng)得很好。剛才討論的那種架構,也特別適合在大量出貨的領(lǐng)域。移動(dòng)設備、客廳設備、數碼相機,這些都是我們做得非常好的地方。這幾個(gè)領(lǐng)域四大廠(chǎng)商中的三位,十大廠(chǎng)商中的六個(gè)都是我們的客戶(hù)。
我們主要是在DPP方面擁有很強的知識積累,但同樣的影響也已經(jīng)開(kāi)始在云計算上面出現。當然,現在云計算的變化還比較慢,部分原因是它并非對功耗如 此敏感,但我認為整體上還是會(huì )有影響的。
6、您會(huì )在很多其他領(lǐng)域譬如數字電視和有線(xiàn)通信,使用這種結構?
Chris Rowen :當然。那些可以為不同應用優(yōu)化處理器的架構是很重要的。而且我們也發(fā)現,即使在一個(gè)新的水平,很多需求也是 相似的。因此同樣的Hi-Fi工具,同樣的音頻DSP,即可部署在世界最好的智能手機上,也同樣可以部署在最好的數字電視、藍光(Blue Ray)影碟機上。因為它是非常小而快的。這方面的要求是相同的。
同樣,如果你看下Altas LTE的內部架構,其主要構造模塊BBE16或許是世界上最快的DSP核。而它同樣也在數字電視解調子系統中使用。同樣再一次因為它的快速、易編程,以及 節約功耗。所以,我們可以看到在手機和客廳之間,在這兩個(gè)媒體處理器和基帶處理器之間,都有著(zhù)共同的需求。
7、我看到您說(shuō),芯片的整合將集中在射頻、存儲和數字電路。那么您覺(jué)得它們三者還有可能合并成一個(gè)嗎?
Chris Rowen :嗯。如果你從半導體工藝(Semiconductor Process)技術(shù)的角度來(lái)看,我認為在晶體管和器件優(yōu)化的層面將會(huì )有些事情發(fā)生。因此在某些情況下,你可以作出權衡。特別是,我們正與很多客戶(hù)一起工 作,以簡(jiǎn)化射頻電路。通過(guò)盡量多的數字處理器,你可以部分程度地脫離射頻和數字間的邊界。由于相比射頻而言,數字會(huì )有更加陡峭的生產(chǎn)成本曲線(xiàn)(Cost Production Curve),我們也就有更大的動(dòng)力去做。因此,我們會(huì )越來(lái)越依賴(lài)于數字方面的有效解決方案。
同樣的事情發(fā)生在存儲器。人們偶爾也會(huì )使它們結合在一起,但不是一個(gè)簡(jiǎn)單的組合,內存的加工設備(Fabrication Facility)與一般的優(yōu)化有所不同。所以我相信,多芯片封裝(Multi-Chip Packaging)將越來(lái)越重要。尤其當你將芯片組(Die)一塊又一塊摞起來(lái)的時(shí)候。所以,你可以在數字芯片組上面摞存儲芯片組,然后上面再摞射頻芯 片組。這有可能在成本上是最劃算的。然后也可能有一種折衷的工藝技術(shù),把它們所有三個(gè)都放在一塊硅片上。這取決于你的應用程序,比如需要一些存儲單元,又 或者需要一些射頻的單元。
但最終,我想我們還會(huì )堅持三套不同的加工工藝,然后依靠封裝技術(shù)來(lái)整合在一起。不過(guò)這并不意味著(zhù),只要你能想辦法把它們三個(gè)捏一塊兒,你就得到一個(gè) 系統(System)了。因為還有物理屬性的要求,比如要多加塊電池什么的。但總的來(lái)說(shuō)你要知道,物理尺寸是會(huì )越來(lái)越小了。
但你要知道還有個(gè)巨大的挑戰,就是人們的手指不能變小,眼睛也不能變小。 (EEtrend:尤其是男生,哈哈?。?,所以所謂得到“小尺寸”的設備,我們還是有實(shí)際限制的。我們在元器件層面的小,其實(shí)是對應于我們自己可以接受 多小的屏幕和按鈕。所以說(shuō)到最后,這事兒還是更和成本相關(guān)。
8、在書(shū)里您還預測了FPGA的未來(lái)。而幾天之前,Xilinx宣布嵌入ARM 的Cortex A9核。您覺(jué)得這是否是一種新趨勢?是否與Tensilica的 DPU形成競爭呢?
Chris Rowen :其實(shí)……并沒(méi)啥。我的意思是這種往處理器里一股腦嵌入FPGA的活兒,大概已經(jīng)折騰了快10年了。 Altera宣布他們與ARM互相嵌的時(shí)候,讓我想想啊,也是8年前了吧? (Larry:沒(méi)錯?。?nbsp;
所以,這就跟任何一個(gè)系統想要找塊芯片,或者三塊芯片一塊兒呆著(zhù),沒(méi)啥區別。當然,偶爾你也會(huì )碰巧搞出一塊啥都囊括了的數字芯片。話(huà)說(shuō)回來(lái),FPGA兄弟們有一個(gè)根本性的挑戰,那就是FPGA的通用性非常高,可以做的事兒也賊多。但禍福相倚,要是讓它專(zhuān)注做一件事的話(huà),也就不是那么有效率 了。所以,如果你想真正有效地利用處理器,我估計你情愿在處理器里隨便嵌一個(gè)稍微穩定點(diǎn)的東西,而不是FPGA。
我認為這是非常自然的一步。Xlinx以前也搭過(guò)Power PC,對吧?這其實(shí)是一碼事。它壓根沒(méi)有改變任何原有的架構,也沒(méi)有在CPU和FPGA的功能之間取得任何邏輯上的合并(Merge)。部分是因為他們沒(méi) 有任何合并的工具軟件模式。
當然,FPGA是很容易配置的,而且價(jià)格也便宜。因此,他們占據了一部分的市場(chǎng),尤其是那些量低而開(kāi)發(fā)成本又低的。因此,我們在市面上看到大量的 FPGA設計。但是基于FPGA的設計總量是很小的。它其實(shí)是一個(gè)利基(Niche)市場(chǎng)。極端地說(shuō),即便有很多工程師在使用它,但幾乎所有都是低產(chǎn)量 的。
所以我的意思是,FPGA很重要,但不是Tensilica公司關(guān)注的。我們專(zhuān)注于高產(chǎn)量,并且幫助那些試圖在設計上節約幾納米硅片的兄弟 們。(EEtrend:完全兩個(gè)不同的群體咯?)是啊,他們離得是遠了點(diǎn)兒。當然他們偶爾也會(huì )重疊。譬如基站。以前有很多基站是采用Altera的儲存方 案的。挺重的。慢慢地我們看到越來(lái)越多因為容量、成本和功耗的要求,從FPGA轉向了更加高集成度的芯片解決方案。
9、我在IEEE的設計與測試(Design & Test)上看到一篇您的談話(huà)。您說(shuō),如果我們想要進(jìn)入嵌入式系統設計的大規模并行領(lǐng)域,可配置的多核處理器SoC就有一些問(wèn)題必須得到解決。幾年前,您 還提到過(guò),Intel最大的問(wèn)題是怎樣為通用計算應用配置多核處理器。您現在還覺(jué)得多核處理器遭遇困境嗎?
Chris Rowen :這個(gè)……其實(shí)是分開(kāi)的兩碼事。對于多核應用層面而言,確實(shí)存在著(zhù)重大考驗。就是如何找到足夠多的線(xiàn)程 (Thread)來(lái)運行。但它不是Intel單獨遇到的問(wèn)題。這是一個(gè)涉及到應用程序是如何被調用,以及在當下如此小型的設備上如何架構的問(wèn)題。即便打開(kāi) 我自己的筆記本電腦,當我想看看到底有多少個(gè)線(xiàn)程準備在跑,它基本上都是很少的。通常情況下,操作系統、用戶(hù)界面和應用程序開(kāi)發(fā)等等所調用的方式,都完全 沒(méi)有最大化利用線(xiàn)程的數量。
所以,我認為你在基本的架構層面可以做的,就是提供更多的線(xiàn)程運行,并且充分地利用到并行。當然在應用層面也會(huì )有很多層級限制。你知道現在很方便就 去搞個(gè)四核八核十六核的,但是在PC這一端,相對于服務(wù)器,只有相對較少的條件可以讓我們找到這些線(xiàn)程。于是一大現象便是操作系統和應用程序的逐步重組 (Restructuring)。
另一個(gè)同樣重要的現象是,確定哪些任務(wù)可以被放進(jìn)數據層(Data Plane)。讓我們來(lái)想想哪些東西通常是可以被放進(jìn)數據處理器的,譬如在無(wú)線(xiàn)信道這類(lèi)的通訊子系統,譬如存儲系統,比如你怎么分發(fā)數據,或者你知道的, 安全冗余,也可能是針對壓縮流(Packing Stream)的特殊網(wǎng)絡(luò )處理器,它可以是視頻也可以是音頻。這些東西其實(shí)是更本質(zhì)(Inherently)的并行處理。
所以吧,我覺(jué)得這里有兩種并行重組。其一是所謂的,去各地兒找更多的線(xiàn)程應用。另一種是為了維持整體系統中卸載(Off Loading)并行部分的最大值,并讓之進(jìn)入數據層。實(shí)際上我認為,在數據層提取并行是更容易操作的。因此,在數據層有效使用多核的數量,遠大于單單在 應用層面使用的多核。這也就是為啥我們認為自己正走在康莊大道上。關(guān)注于數據層,可以使我們在多核方面的成長(cháng)速度大大超過(guò)那些只盯著(zhù)應用層面的兄弟。
10、所以在手機上就不是個(gè)問(wèn)題咯?
Chris Rowen :恩可以這么說(shuō)。這變得相當容易,讓我們舉一個(gè)LTE基帶(Baseband)的例子吧。我們的Atlas平 臺可以弄出七或八核,取決于你想怎么用。DoCoMo和他的合作伙伴,NEC、富士通以及松下,已經(jīng)宣布并且詳細描述了他們LTE基帶架構。第一代是8到 10核。另一個(gè)叫做Blue Wonder Communication的合作伙伴也推出了他們的8至10核的LTE基帶。因此,現在就有三種不同的LTE基帶,而這三種都使用了約8個(gè)核。在這個(gè)層 面上是可以有大量的并行解決方案的。
再看看下一代的LTE,大概有六點(diǎn)性能方面的因素需要考慮。其中一些是單核怎樣可以更快,但更大部分和多核有關(guān)。所以我們很容易找到那些有效應用而 20核甚至更多核于單一功能譬如基帶的案例。和那些圍觀(guān)應用處理器的哥們比起來(lái),他們如果感覺(jué)好,就整兩個(gè)核玩玩;如果還很爽,那就再整四個(gè)。我覺(jué)得在數據層和應用層上,多核是有完全不同的機會(huì )的。(E:太清楚了?。?nbsp;
11、時(shí)間不早了,最后一個(gè)問(wèn)題吧。您當年在斯坦福參與奠基了RISC 架構,后來(lái)也曾是MIPS的共同創(chuàng )始人。那么,請問(wèn)您如何看待RISC架構的未來(lái)?依舊是ARM和MIPS之間的戰爭,抑或會(huì )發(fā)生一些新的大事件?
Chris Rowen :這個(gè)……在科學(xué)上,理想架構已經(jīng)完全改變了。這場(chǎng)關(guān)于CISC和RISC架構的爭論,其實(shí)就是通用 (General Purpose)架構甲跟通用架構乙之間的競爭罷了。RISC贏(yíng)得了一職半銜,是因為在某個(gè)特定時(shí)期內它手下有好幾十項半導體技術(shù)。但在這場(chǎng)戰爭中,摩爾 定律一下給出了這么多的晶體管,以至于你隨便搞個(gè)簡(jiǎn)單的解碼或者流水線(xiàn),都能奢侈地愛(ài)用多少就用多少。沒(méi)人管。所以一個(gè)RISC解碼器可能要一萬(wàn)門(mén),而 CISC解碼器需要五萬(wàn)門(mén)。其實(shí)也差不多了多少。
不過(guò)我覺(jué)得除了通用架構之間互掐以外,還有一場(chǎng)更加深遠的革命。我們現在來(lái)比較通用架構和一大家子的特殊用途(Special Purpose)架構,怎么樣?幾乎任何時(shí)候你都可以說(shuō),如果一個(gè)產(chǎn)品是圍繞某種特定的需求來(lái)設計,那么特殊用途架構鐵定勝出。 RISC扁了CISC一段時(shí)間,因為它的效率高出2倍以上。那么為具體應用特殊定制的架構,就比所有通用架構都高效5至10倍以上了。
因此,這個(gè)世界不能再簡(jiǎn)單分成我的通用架構,和你的通用架構。當然對于那些非常分散(Defused)并且普適(Generic)的應用程序,就好 比在筆記本上用的那些,我們還是需要通用架構的。因為一會(huì )兒你要看視頻,一會(huì )兒又要運行Word或(E:打游戲),對,或者Excel工作表。這是非常多 樣的。所以你需要一個(gè)德智體全面發(fā)展的處理器。不能太特別。
但總之,你不得不面對一個(gè)世界,那里有各種各樣不同的任務(wù),而每樣任務(wù)都是獨特的。而且更為重要的是,當你因為摩爾定律而在芯片上集成的片上系統越多,你越會(huì )發(fā)覺(jué)有足夠多的處理器適用于各種特定的應用子系統。
因此對于我來(lái)說(shuō),計算的未來(lái)不是產(chǎn)生新的通用架構,而是特殊用途架構的集合。譬如一個(gè)音頻子系統、視頻子系統,一個(gè)基帶子系統、存儲子系統,哦對, 還有應用處理器子系統。其中只有一個(gè)需要通用的結構(Construction),其他里面都將是特殊的架構。在科學(xué)上,摩爾定律帶來(lái)多核,多核又將帶來(lái) 特殊架構的解決方案。異型多核(Heterogenic Multi-Core)就是一種新架構。而且我覺(jué)得會(huì )成為主流。Intel、ARM、MIPS這些公司當然還會(huì )有很大的市場(chǎng),但只限于應用處理器領(lǐng)域。其 實(shí)在科學(xué)上,通用目的(General Purpose)最終就會(huì )變成某一個(gè)特殊目的(Specific Purpose)。
(E:這真的很有趣。謝謝您?。?nbsp;
Chris Rowen :歡迎。你們的問(wèn)題都蠻好玩的。
關(guān)于Tensilica公司
Tensilica是業(yè)界領(lǐng)先的且經(jīng)驗證的可配置處理器IP供應商。數據處理器結合了CPU和DSP的功能,針對不同應用可以提高10到100倍的性能,Tensilica的自動(dòng)化處理器設計工具能夠針對應用快速定制內核,以滿(mǎn)足其特殊的數據處理性能需求。Tensilica可配置處理器為OEM制造商及世界前十大半導體廠(chǎng)商中的五家廣泛使用,這些產(chǎn)品包括移動(dòng)電話(huà)、消費類(lèi)電子設備(包括數字電視,藍光DVD,寬帶機頂盒,便攜式媒體播放器)、計算機、存儲、網(wǎng)絡(luò )和通訊芯片。更多關(guān)于Tensilica獲得專(zhuān)利的可配置處理器產(chǎn)品信息,請訪(fǎng)問(wèn)公司網(wǎng)站:www.tensilica.com .
編者垂注:
Tensilica和Xtensa商標所有權歸Tensilica, Inc所有,所有其它公司的產(chǎn)品,公司名稱(chēng)和商標歸各自公司所有。
Tensilica’s announced licensees include ADDMM, Afa Technologies, ALPS, Aquantia, Astute Networks, Atheros, AMD (ATI), Avision, Bay Microsystems, Berkeley Wireless Research Center, Brocade, Broadcom, Cisco Systems, CMC Microsystems, Conexant Systems, Design Art Networks, DS2, EE Solutions, Epson, ETRI, FUJIFILM Microdevices, Fujitsu Ltd., Fujitsu Microelectronics Ltd., Hudson Soft, iBiquity Digital, Ikanos Communications, Intel, Juniper Networks, LG Electronics, Lucid Information Technology, Marvell, NEC Laboratories America, NEC Corporation, NetEffect, Neterion, Nethra Imaging, Nippon Telephone and Telegraph (NTT), NuFront, NVIDIA, Olympus Optical Co. Ltd., Panasonic Mobile, Penstar, Plato Networks, PnpNetwork Technologies, PowerLayer Microsystems, SiBEAM, Silicon Optix, Sony, STMicroelectronics, Stretch, TranSwitch Corporation, Triductor Technology, u-Nav Microelectronics, UpZide, Valens Semiconductor, Validity Sensors, Victor Company of Japan (JVC), WiLinx, WiQuest Communications, and XM Radio.
晶體管相關(guān)文章:晶體管工作原理
晶體管相關(guān)文章:晶體管原理 攝像頭相關(guān)文章:攝像頭原理
評論