架構與ISA:移動(dòng)處理器的真正關(guān)鍵
我最近參加了the Linley Tech Mobile Conference (Linley Tech移動(dòng)技術(shù)研討會(huì )),這是每年在硅谷連續舉辦兩天的技術(shù)研討會(huì ),聚焦于移動(dòng)處理議題。參與的廠(chǎng)商包括Synopsys、英特爾、GLOBALFOUNDRIES、高通(容我補充,這些都是Imagination日益壯大的生態(tài)系統伙伴)以及其他許多公司。
本文引用地址:http://dyxdggzs.com/article/201610/307487.htm今年,在圣塔克拉拉熟悉的景色和Hyatt Regency酒店中,這場(chǎng)盛會(huì )再度登場(chǎng)。這是讓媒體、分析師、資深工程師和經(jīng)理人等眾多科技產(chǎn)業(yè)從業(yè)人員齊聚一堂的好地方。
我的簡(jiǎn)報是排在第三個(gè)議程,主題為移動(dòng)CPU。我解釋了為什么盡管所有的趨勢都朝高端軟件開(kāi)發(fā)和抽象級發(fā)展,而不重視底層的CPU與GPU指令集架構(ISA)。但是當設計CPU、GPU和移動(dòng)裝置用的其他處理器時(shí),利用從一開(kāi)始就為可擴展性建構的高效處理架構還是會(huì )帶來(lái)顯著(zhù)的差異。
功率和日益縮短的產(chǎn)品開(kāi)發(fā)周期 ─ 移動(dòng)處理器的競爭態(tài)勢
移動(dòng)產(chǎn)品開(kāi)發(fā)目前面臨著(zhù)兩個(gè)非常不同的挑戰,這些挑戰限制了運算技術(shù)進(jìn)展的腳步,并又返過(guò)來(lái)直接影響到移動(dòng)應用處理本身。
一方面,功率是每一家主要處理器IP和芯片供應商試圖主導市場(chǎng)的終極戰場(chǎng)。因此,系統設計人員必須謹慎在高效能和低功耗間取得平衡,這也影響著(zhù)每個(gè)SoC設計的重大決定。此議題已經(jīng)主導了28納米設計,并將會(huì )繼續影響20納米以下的SoC設計。但更重要的是,散熱議題已成為超越移動(dòng)應用領(lǐng)域,從嵌入式運算和移動(dòng)運算擴大到網(wǎng)絡(luò )、M2M和物聯(lián)網(wǎng)等各種市場(chǎng)的關(guān)鍵考慮方面。
我們遭遇的另一個(gè)重大挑戰是產(chǎn)品開(kāi)發(fā)周期越來(lái)越短。過(guò)去,18~24個(gè)月的開(kāi)發(fā)周期是常態(tài),但現在我們看到有些客戶(hù)將時(shí)間縮短到每6~12個(gè)月就推出新款芯片。這需要投入龐大的設計工作,而且當產(chǎn)品要滿(mǎn)足不同層級市場(chǎng)的需求時(shí),耗費的研發(fā)精力會(huì )更大。
融合趨勢使得一些傳統以來(lái)不會(huì )快速推出新產(chǎn)品的市場(chǎng)也大幅加速了設計周期,像是智能電視、便攜式游戲機或連網(wǎng)汽車(chē)都需要采用最新科技,才能獲得已習慣于使用口袋卡片個(gè)人計算器的消費者青睞。
不管是針對重復使用或是能夠更妥善地在單一芯片上分配不同的運算資源,程序代碼可移植性都是解決低功耗與縮短開(kāi)發(fā)周期挑戰的解決方案。這是異構處理革命的基礎,也是能將這一愿景變成現實(shí)的技術(shù),同時(shí)可避免程序代碼對低端硬件的依賴(lài)性。今天的CPU會(huì )執行許多通用軟件,但是,現有SoC各功能方塊的利用率必須提升,才能適應未來(lái)效能增加的需求。LLVM便是一個(gè)很好的例子,它免除了程序對底層ISA的依賴(lài),并能實(shí)現程序代碼橫跨不同裝置與架構的可移植性目標。
PowerVR GPU推升異構處理效率
Imagination的PowerVR ‘Rogue’ 架構 可為移動(dòng)裝置提供約1 TFLOPS的效能。定義系統效能和特性的一個(gè)重要部分F已與繪圖和這些高度平行處理器的運算潛能有關(guān)。
傳統以來(lái),繪圖效能主要是用來(lái)推動(dòng)裝置的顯示功能。

但由于繪圖處理具備了足虻墓δ埽所以提升SoC的效率將取決于發(fā)揮GPU的潛力。這可通過(guò)新的和增強的API、可擴充軟件解決方案和統一的編程環(huán)境來(lái)實(shí)現。
重新認識RISC架構概念
盡管此趨勢已逐漸興起,CPU仍然是系統中主要且最常用的通用可編程單元。Imagination的MIPS架構發(fā)展可追溯到30年前John Hennessy和他的團隊將編譯程序理論的專(zhuān)業(yè)知識帶到單純的RISC架構構建中,推動(dòng)了優(yōu)化編譯程序的進(jìn)展。
30年之后,這樣的想法剛好與業(yè)界期望在運行期間采用JIT/動(dòng)態(tài)編譯程序技術(shù),以向程序代碼可移植轉移的趨勢相同。MIPS ISA的特性包括每指令單一運算、簡(jiǎn)易尋址模式、非預測執行或非整數條件位等,可為現實(shí)世界帶來(lái)實(shí)際效益,以協(xié)助系統設計人員實(shí)現更高的效能,開(kāi)發(fā)出高頻執行的高端、超標量、亂序CPU,并同時(shí)保持低功耗特性。
也就是說(shuō),盡管這些技術(shù)能讓業(yè)界脫離底層ISA的歷史包袱,但固有的架構特性對動(dòng)態(tài)編譯效能、如何有效地將架構構建在芯片中,以及支持開(kāi)放標準與操作系統來(lái)說(shuō),仍然非常重要。
proAptiv CPU是Imagination無(wú)須妥協(xié)的MIPS架構如何能帶來(lái)高效能、低功耗CPU的最好例子。舉例來(lái)說(shuō),架構中缺乏預測性指令可簡(jiǎn)化分支預測方法的建構,這是proAptiv CPU具備領(lǐng)先的同級預測效能的主要原因。

進(jìn)一步提升的架構效率與微架構設計選擇,使得此核心在推出時(shí)便能提供同類(lèi)產(chǎn)品的最高CoreMark/MHz CPU分數,與競爭性CPU方案相比,面積更是縮小了約60%。
移動(dòng)CPU ─ 不僅是應用處理器
但應用處理器不僅是移動(dòng)SoC中的CPU。其他的功能,像基帶中的通信處理,它與移動(dòng)裝置的網(wǎng)絡(luò )功能有關(guān),也非常重要,而且也能受益于其它的架構特性。多線(xiàn)程處理器能以與單核心CPU相近的面積與功耗提供更高效能。
這能通過(guò)內置的硬件調度器和輸出限定器(yield qualifier)?,來(lái)實(shí)現更佳的實(shí)時(shí)/確定性處理需求和服務(wù)質(zhì)量(QoS)。運用我們的多線(xiàn)程和多核解決方案,客戶(hù)能用我們和合作伙伴共同開(kāi)發(fā)的優(yōu)化LTE基帶堆棧和多家供應商提供的多線(xiàn)程RTOS來(lái)建立優(yōu)異的基帶解決方案。與采用單線(xiàn)程的內核相比,利用此技術(shù)能為L(cháng)TE流量提升37~53%的數據處理量。

總之,異構運算的基本技術(shù)已開(kāi)始用來(lái)推動(dòng)移動(dòng)運算的發(fā)展。Imagination提供廣泛的IP產(chǎn)品組合,以擁抱可擴展、可移植、高度開(kāi)放和標準導向的未來(lái)。我們相信,架構(CPU、GPU或其他)應根據它們的真實(shí)效能來(lái)相互競爭,產(chǎn)業(yè)將不再像過(guò)去一樣受限于單一ISA架構,而會(huì )有更快速的發(fā)展。
評論