【導讀】藍廠(chǎng)發(fā)布新旗艦X90,最支棱的就是發(fā)哥!懂不懂什么叫「合體」???
等下,蘋(píng)果芯片的性能竟然被「秒」了?而且這次出手的還是「發(fā)哥」?看起來(lái),這次聯(lián)發(fā)科與vivo深度合作開(kāi)發(fā)的新旗艦,不僅要顛覆安卓老格局,這是想連蘋(píng)果都要一起拉下馬了。
真·地表最強:藍廠(chǎng)帶著(zhù)發(fā)哥,支棱起來(lái)了
這次發(fā)哥新推出的天璣9200配備了1+3+4八核CPU架構,是首款臺積電第二代4nm制程工藝平臺,也是首款第二代Armv9架構。CPU:1個(gè)最高主頻達到3.05GHz的X3超大核,3個(gè)2.85GHz的A715,4個(gè)1.8GHz的A510,外加8MB三級緩存和6MB系統緩存,功耗比天璣9000降低25%。GPU:11核G715 ,支持硬件光追,GPU性能提升32%,功耗降低41% 。
從極客灣放出的Geekbench 5 CPU跑分顯示,天璣9200多核跑分為4459分,比天璣9000有一定提升,不過(guò),極客灣測試使用的是工程機,分數僅供參考。從CPU多核性能看,整體略強于蘋(píng)果A14水平,距離A15和A16還有一定距離。
來(lái)源:極客灣而在GPU上,天璣9200表現驚艷。在極客灣給出的GFX Bench 5.0測試結果中,天璣9200一枝獨秀,不僅將安卓一眾對手甩在身后,甚至超過(guò)了蘋(píng)果A16的GPU表現,而且優(yōu)勢明顯。雖然這與蘋(píng)果這一代連牙膏都懶得擠有很大關(guān)系,但不管怎么說(shuō),發(fā)哥這回支棱得確實(shí)是有點(diǎn)生猛。
來(lái)源:極客灣對于一般手機用戶(hù)而言,說(shuō)到跑分排行榜,說(shuō)一千道一萬(wàn),沒(méi)有「那個(gè)軟件」的排行榜,都是野榜。據聯(lián)發(fā)科方面自己公布的9200平臺跑分圖,這個(gè)分數為126萬(wàn)+,比天璣9000提高了25%以上。相比之下,高通驍龍的8+Gen只有111萬(wàn)。這還不算什么,藍廠(chǎng)和聯(lián)發(fā)科聯(lián)合深度調校的vivo史上最強旗艦X90系列,更是在安兔兔v9上跑出了突破128萬(wàn)分的成績(jì)。
而且,無(wú)論是哪個(gè),都擊敗了內置蘋(píng)果M1芯片(跑分為125萬(wàn))的蘋(píng)果iPad Pro。真就是,發(fā)哥戰未來(lái)?連架構都改?自研芯片叒升級
更「可怕」的是,這幫人除了調校出了地表最強的天璣9200,竟然還帶來(lái)了全新的自研芯片V2。而這距離上一代V1+的推出,才剛剛過(guò)了7個(gè)月……簡(jiǎn)單來(lái)說(shuō),V2是一顆從場(chǎng)景事件出發(fā),針對AI大密度算法算力需求,量身定制的「低功耗AI加速芯片」。
要實(shí)現這一點(diǎn),就需要深入底層技術(shù),甚至對芯片的架構「動(dòng)刀」。對于手機AI計算而言,大致可分為平臺和外掛兩種解決方案:- 外掛芯片可減少軟件調度,高效專(zhuān)注于大密度AI運算,但在特定場(chǎng)景下的運算缺乏靈活性;
- 平臺SoC軟件部署靈活,NPU峰值算力上限高,但難以滿(mǎn)足大密度運算的算力需求。
但是問(wèn)題來(lái)了,這兩種芯片不僅架構不同,而且指令集也完全不同。于是,在嘗試了若干種芯片間高速通信的方案之后,vivo的系統架構師和工程師終于設計出FIT(Frame Info Tunneling)雙芯互聯(lián)技術(shù)。
FIT的原理其實(shí)很簡(jiǎn)單,首先需要把大型復雜算法模塊進(jìn)行拆分。然后,把算力密度小、網(wǎng)絡(luò )結構復雜的小模型部分,通過(guò)軟件部署在平臺NPU上。同時(shí),把算力密度大、數據吞吐密集的大模型部分,部署在自研芯片V2硬件上,讓其中的三個(gè)單元處理各自擅長(cháng)的運算內容。最終,實(shí)現了在1/100秒內完成雙芯互聯(lián)同步的高速協(xié)同計算。
而FIT雙芯互聯(lián)的最直接應用,就是vivo最擅長(cháng)的計算攝影了。由于傳統ISP的濾波器普遍是手工設計的,雖然能以極低延時(shí)處理大量的數據流水,但是只能解決已知的、特定的問(wèn)題。那么對于那些復雜、未知的問(wèn)題來(lái)說(shuō),最好的解決方案就是救助于人工智能。但是,當你把AI軟件算法部署到NPU上時(shí),就需要以幀或塊為單位進(jìn)行處理信號。相比之下,傳統的ISP卻是以行為單位。與此同時(shí),由于絕大部分平臺SoC片上SRAM容量有限,大量AI算法在接入ISP 管道后,要通過(guò)外部DDR來(lái)完成數據暫存和交互。這就會(huì )造成運算與數據分離,犧牲了高性能AI運算至關(guān)重要的Data-Locality要求,進(jìn)一步降低了性能。為了解決這一問(wèn)題,vivo在自研芯片V2上,把傳統的ISP架構升級為AI-ISP架構。進(jìn)而通過(guò)FIT雙芯互聯(lián),第一次將平臺ISP-NPU與自研芯片V2的ISP-DLA作為一個(gè)整體,設計出了目前來(lái)說(shuō)最合理的AI算法處理架構。而這,也是在異構多芯片計算方向上,邁出的至關(guān)重要的第一步。
從結構上來(lái)看,V2的可以分為三個(gè)部分:- 圖像處理單元
- AI計算單元
- 片上內存單元
具體來(lái)說(shuō),對于移動(dòng)端的AI處理,有三個(gè)相互關(guān)聯(lián)且共同決定能力上限的要素——算力容量,算力密度和數據密度。平臺SoC算力容量大,適合部署網(wǎng)絡(luò )結構復雜的模型,但能效比不高,無(wú)法滿(mǎn)足對大密度AI運算的需求。于是,vivo在自研芯片V2的設計中,加入了近存深度學(xué)習加速器(DLA)。其中,近存DLA通過(guò)全硬化MAC設計和大容量專(zhuān)用片上SRAM,強化算力密度和數據密度,從而釋放算力容量的潛力。
在算力密度上,得益于全硬化MAC設計,V2的近存DLA在實(shí)際AI運算中,能夠達到100% MAC利用率。相比在平臺SoC軟件部署AI運算,8bit算力密度提升了2-3倍。此外,vivo還針對專(zhuān)業(yè)視頻的10bit處理需求,在自研芯片V2中專(zhuān)門(mén)硬化了10bit的MAC單元——相比平臺SoC軟件部署所采用的合并運算方式,10bit算力密度提升了4-6倍。
另一方面,數據密度受到傳統架構von Neumann內存墻的制約,大密度運算會(huì )遇到數據填喂不足、運算等待數據的問(wèn)題,極大限制了計算性能。為保證數據密度與算力密度的完美匹配,自研芯片V2在近存DLA內配套設計了速度高達1.3萬(wàn)億bit/s的專(zhuān)用片上SRAM,并把容量提升到了等效45MB,比前一代的V1大了40%。這種近存DLA的設計,大幅減少了數據尋址和搬運的功耗,與通常NPU采用的DDR外存設計相比,SRAM數據吞吐功耗理論最大可減少99.2%。
算力密度和數據密度的雙重提升,以及多項低功耗電路設計方法的加持,讓自研芯片V2的近存DLA在同等芯片制程條件下的表現遠超同行競品。也就是說(shuō),內核每瓦算力在運行8bit MAC和10bit MAC時(shí),分別達到了16.3TOPS/W和10.4TOPS/W。
如此一來(lái),在部署相同算法時(shí),自研芯片V2相比傳統NPU,能效比提升了200%。不出意外的話(huà),在全新的AI-ISP架構下,配合FIT雙芯互聯(lián)、近存DLA、專(zhuān)用片上SRAM等多項突破性設計,全新的V2又會(huì )讓手機計算攝影再次「起飛」。給我翻譯翻譯什么叫「專(zhuān)業(yè)攝影」
說(shuō)到效果,也是顯而易見(jiàn):長(cháng)焦不抖了,暗光不糊了,就連按快門(mén)也沒(méi)延遲了。要知道,專(zhuān)業(yè)相機的快門(mén)延遲在30ms左右,而手機的快門(mén)延遲一般在170-300ms。結果就是,同時(shí)按下的快門(mén),相機都出完片了,手機這邊可能還沒(méi)開(kāi)始曝光。于是,vivo全面優(yōu)化了圖像處理管線(xiàn),通過(guò)提升Sensor啟動(dòng)速度,將快門(mén)延遲低到了專(zhuān)業(yè)相機的30ms。
手機長(cháng)焦拍攝通常存在兩個(gè)問(wèn)題:拍攝倍率過(guò)大時(shí)畫(huà)面會(huì )模糊(拍不清)、手持運鏡導致畫(huà)面劇烈抖動(dòng)(拍不穩)。為此,vivo借鑒科研領(lǐng)域天文望遠鏡和高端顯微鏡的圖像處理流程,帶來(lái)全新的超清畫(huà)質(zhì)引擎。超清畫(huà)質(zhì)引擎從底層改寫(xiě)了ISP圖像處理鏈路,將圖像處理AI化,包含了Denoise降噪、Demosaic細節恢復、Deblur去模糊三大重要模塊,以及蔡司光學(xué)超分算法。
其中,核心便是vivo和蔡司聯(lián)合研發(fā)的蔡司光學(xué)超分算法。這套算法,能根據每個(gè)手機的模組特性做建模分析,通過(guò)逆運算動(dòng)態(tài)調整,補償光學(xué)信息,突破鏡頭工藝的上限。在蔡司光學(xué)超分算法的加持下,5倍以上的焦段,拍攝解析力最高提升35%。
在應對「手抖」方面,就到了Ultra Zoom EIS出場(chǎng)的時(shí)候了。這項技術(shù)包含了IMU(慣性測量單元)、OIS光學(xué)防抖與EIS電子防抖三大模塊。其中,IMU負責檢測抖動(dòng),OIS/EIS負責抵消抖動(dòng),軟硬協(xié)同防抖。如此一來(lái),手機就能在20X以上倍率實(shí)現抖動(dòng)抵消,讓被攝主體在畫(huà)面中趨于平穩不會(huì )晃動(dòng)。
為了確保在暗光場(chǎng)景下也能實(shí)現這樣的能力,vivo做了多個(gè)算法的疊加,在手機攝影的全鏈路上都進(jìn)行了大幅優(yōu)化。首先,vivo和Sensor廠(chǎng)商深度合作,將Sensor ISO高感從上一代的16000提升到102400,暗光場(chǎng)景下的感光能力大幅提升。
其次,在運動(dòng)抓拍時(shí)采用運動(dòng)自適應多幀融合技術(shù),一次快門(mén)生成多幀運動(dòng)畫(huà)面,疊加vivo自研的RawEnhance2.0算法,可以把每一幀有用信息疊加在一起,讓暗光運動(dòng)也無(wú)拖影。結果就是,在5lux的暗光環(huán)境下,畫(huà)面的細節表現提升17.3%的同時(shí),噪聲降低了46%。
此外,vivo這類(lèi)拍攝上還采用了新一代運動(dòng)測量與跳躍檢測算法,運動(dòng)畫(huà)面定格能力相較于上一代提升58%。
什么是產(chǎn)品力?我可以不用,你不能沒(méi)有
「發(fā)哥」的芯片再厲害,最終的載體還是手機。而一部好用的手機,往往是芯片廠(chǎng)商和手機廠(chǎng)商精誠合作的結晶。作為一個(gè)主打年輕用戶(hù)的手機廠(chǎng)商,這些年vivo一直在探索一個(gè)問(wèn)題:年輕人用手機,最看重什么?流暢游戲、動(dòng)畫(huà)絲滑、光速加載、屏幕不傷眼、多任務(wù)切換不卡、拒絕「殺后臺」、續航不拉胯......即使有些佛系用戶(hù)的要求要低得多,但手機行業(yè)卷了這么多年,「我可以不用,你不能沒(méi)有」早已成為衡量旗艦安卓機的產(chǎn)品力的一個(gè)基準。作為國內手機大廠(chǎng)之一,早在20個(gè)月之前,vivo與聯(lián)發(fā)科就已經(jīng)展開(kāi)密切合作。雙方在影像、游戲、AI、顯示、通信、功耗、UX性能等多領(lǐng)域展開(kāi)深度聯(lián)合研發(fā)。
此次,雙方加深合作深度,帶來(lái)了5個(gè)聯(lián)合研發(fā)的重磅功能:MCQ多循環(huán)隊列、王者榮耀自適應畫(huà)質(zhì)模式、芯片護眼、APU框架融合、AI機場(chǎng)模式。MCQ多循環(huán)隊列:多核場(chǎng)景,高速傳輸MCQ多循環(huán)隊列,是業(yè)內針對未來(lái)多核場(chǎng)景考量,為發(fā)揮CPU極致性能,重新定義的一款全新處理引擎。MCQ最多可為CPU和UFS之間的數據交換提供8條通道傳輸,有效提升CPU的數據并發(fā)處理能力,讓?xiě)密浖袚Q和后臺下載喚醒更快、更流暢。
經(jīng)測試,搭載MCQ技術(shù)后,隨機寫(xiě)入速度增加了16.7%以上,安兔兔跑分近5000分,而在更多更實(shí)用的場(chǎng)景的體驗也有明顯提升——比如大型APP的安裝速度。在vivo和聯(lián)發(fā)科的聯(lián)合開(kāi)發(fā)下,天璣9200旗艦平臺成為行業(yè)首個(gè)支持MCQ的平臺,相信越來(lái)越多的平臺會(huì )頻繁使用到這一功能。
王者榮耀自適應畫(huà)質(zhì)模式:提升續航,控制溫度該模式由vivo攜手聯(lián)發(fā)科、王者榮耀三方聯(lián)合研發(fā),是基于MAGT游戲自適應循環(huán)開(kāi)發(fā)的一項黑科技。vivo透過(guò)平臺服務(wù),與游戲應用間的即時(shí)信息交換,游戲應用可針對信息即時(shí)逐幀調控,達到一個(gè)「自適應閉循環(huán)」。
經(jīng)實(shí)測,開(kāi)啟自適應模式后,在26℃環(huán)境下,在王者榮耀120+極致配置下運行1小時(shí),游戲幀率接近滿(mǎn)幀(119.9),均方差僅有0.92,達到了業(yè)界頂級水平。這個(gè)成績(jì),有點(diǎn)頂了。
芯片護眼:實(shí)時(shí)偵測,實(shí)時(shí)降藍光視力健康現在越來(lái)越被大家重視,護眼也成為年輕人選購手機時(shí)的重要考量因素。最傷眼的「藍光」,自然成為了vivo想方設法要對抗的天敵。芯片在「降藍光」上的角色至關(guān)重要。
vivo和聯(lián)發(fā)科共同在天璣 9200旗艦平臺上開(kāi)發(fā)的智能降藍光技術(shù),能夠實(shí)時(shí)偵測畫(huà)面的藍光占比,通過(guò)創(chuàng )新性的算法并硬化成IP的方式,實(shí)時(shí)降低藍光。讓高能可見(jiàn)藍光占比小于5%,色偏程度降低12%。同時(shí),能夠根據檢測結果動(dòng)態(tài)調整畫(huà)面色彩效果,在降低藍光的同時(shí)保證屏幕不偏色,實(shí)現了行業(yè)性突破。APU聯(lián)合調優(yōu):能效驟增,優(yōu)化協(xié)同天璣9200旗艦平臺的第六代APU690算力高達30TOPS,能效比相較上代提升了45%。基于A(yíng)PU硬件特性,聯(lián)發(fā)科提供了NeuronRuntime軟件加速框架,vivo將NeuronRuntime底層通用能力封裝到自研的VCAP異構計算加速平臺中。從芯片底層到框架層,VCAP在訪(fǎng)存處理、動(dòng)態(tài)量化、指令流水線(xiàn)等維度實(shí)現深度優(yōu)化,讓算法在多個(gè)處理器之間協(xié)同調度,帶來(lái)顯著(zhù)的能效提升。
基于這套方案,vivo在A(yíng)PU上實(shí)現了相機超清文檔、實(shí)況文本、離線(xiàn)語(yǔ)音輸入法等多項應用上的性能優(yōu)化。以離線(xiàn)語(yǔ)音輸入法為例,vivo支持全離線(xiàn)語(yǔ)音輸入,確保數據不出端,用戶(hù)隱私安全不外泄。這是行業(yè)首次實(shí)現語(yǔ)音轉換算法NPU優(yōu)化落地。對比行業(yè)通用的CPU方案,功耗優(yōu)化30%,性能提升50%。
AI機場(chǎng)模式:飛行節能,落地速連AI機場(chǎng)模式包含兩大AI引擎:感知AI引擎、搜網(wǎng)AI引擎。在這一模式下,手機通過(guò)感知AI引擎準確感知用戶(hù)進(jìn)入機場(chǎng)與飛機的起飛降落,再通過(guò)搜網(wǎng)AI引擎來(lái)準確識別目的地,并智能調控搜網(wǎng)策略。
開(kāi)啟這個(gè)模式,若手機開(kāi)啟飛行模式,起飛后至降落前平均可以節能 30%。
關(guān)閉飛行模式后,捕獲網(wǎng)絡(luò )的速度也大幅優(yōu)化。由7.41秒縮短至1.52秒,提速79%。用了30多年的底層算法,改了!
天璣9200旗艦平臺的驚艷表現離不開(kāi)底層的優(yōu)化,vivo與聯(lián)發(fā)科一道,對計算、存儲等底層能力進(jìn)行了內核級創(chuàng )新。完美適應多極限場(chǎng)景,4K60幀視頻錄制功耗大降此次,vivo與MediaTek「雙芯聯(lián)調」的效果首先體現在影像功能的表現上。經(jīng)過(guò)雙方共同優(yōu)化,新平臺多種拍攝場(chǎng)景下的表現大幅提升,并首次以極低的功耗實(shí)現了先進(jìn)的循環(huán)視差網(wǎng)絡(luò ),大幅優(yōu)化能效表現,能耗降低了15%。尤其是在4K 60幀極限錄像場(chǎng)景中,天璣9200的功耗相比天璣9000,足足降低了25%。
游戲:全流程提速,幀數穩定溫度低在游戲場(chǎng)景下,新發(fā)布的Origin OS3不僅帶來(lái)了游戲超分等「黑科技」,還通過(guò)疾速啟動(dòng)引擎和網(wǎng)絡(luò )加速引擎增強游戲表現,對游戲的下載、啟動(dòng)、加載、運行等多個(gè)環(huán)節進(jìn)行全方位優(yōu)化。
而王者榮耀在120幀+極致畫(huà)質(zhì)下,能接近滿(mǎn)幀地運行1小時(shí),就是對冷勁、全速最好的解釋。研發(fā)竟要腳踏「兩條船」
那么,自研芯片的效果到底如何呢?拋開(kāi)更長(cháng)遠的戰略不談,就單從銷(xiāo)量上來(lái)看,完全稱(chēng)得上是「效果拔群」。報告顯示,2022年第二季度在X80的推動(dòng)下,vivo在600美元到799美元(約合人民幣4100元到5470元)區間段銷(xiāo)量同比增長(cháng)504%,vivo的整體銷(xiāo)量同比增長(cháng)91%,取代華為排到了第二位。
不論是影像技術(shù)迭代,還是芯片架構升級,亦或是屏幕顯示優(yōu)化,單純的硬件堆疊和算法配置都無(wú)法真正讓人滿(mǎn)意。實(shí)際上在去年,在vivo首顆自研影像芯片V1推出時(shí),vivo的手機影像正式邁入了硬件級算法時(shí)代。硬件調校自然是硬件廠(chǎng)商的拿手絕活,為了發(fā)揮出硬件的極致潛力,vivo叫上了聯(lián)發(fā)科——把自己的算法、架構固化到芯片層面,與聯(lián)發(fā)科開(kāi)展深度聯(lián)調。vivo與聯(lián)發(fā)科雙方的合作,從一開(kāi)始就確立了一個(gè)目標,軟硬協(xié)同,實(shí)現平臺性能全方面的突破。一年后,當性能和功耗同時(shí)具備驚人表現的天璣9200,遇上vivo的自研芯片,結果就是,「煥然一新」的天璣9200不僅有了更高的能效比、更快的響應速度,而且還擁有更強的游戲體驗。
圍繞這一目標,雙方都投入了精英開(kāi)發(fā)團隊,經(jīng)過(guò)超過(guò)20個(gè)月的開(kāi)發(fā)周期,大幅革新了軟件通路架構,實(shí)現了1+1>2的效果。如果說(shuō),自主研發(fā)是vivo有別于他人的賽道選擇,聯(lián)合研發(fā)則是vivo突破技術(shù)邊界的堅定嘗試。與硬件廠(chǎng)商深度合作,走軟硬件聯(lián)合開(kāi)發(fā),雙管齊下之路,對于構建可持續的健康生態(tài)圈、培養用戶(hù)使用習慣,乃至擴展合作和產(chǎn)業(yè)鏈渠道而言,都是一種追求長(cháng)遠的戰略布局。
在這方面,軟硬件高度一體化的蘋(píng)果,早已經(jīng)走到了行業(yè)的最前頭。而現在,在這條已經(jīng)被無(wú)數成功驗證過(guò)的道路上,出現了越來(lái)越多的前行者。vivo和聯(lián)發(fā)科都知道,合作越深,步子越大,未來(lái)才有前途。正是一直以來(lái)的堅持,讓vivo努力做得比別人更好,在這條路上,vivo走得比別人更踏實(shí)、更長(cháng)遠。 來(lái)源:新智元
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。
pid控制相關(guān)文章:pid控制原理
pid控制器相關(guān)文章:pid控制器原理
電子負載相關(guān)文章:電子負載原理