AIGC手機處理器與傳統AP揮手告別
近年來(lái),隨著(zhù)大模型技術(shù)的迅猛發(fā)展,手機廠(chǎng)商紛紛亮相大模型應用,成為手機發(fā)布會(huì )上的焦點(diǎn)。從OPPO的語(yǔ)音助手升級到vivo的官方宣布自研手機AI大模型,再到小米將大模型直接整合到手機系統中,各廠(chǎng)商的競爭可謂激烈異常。這一切的背后,是智能終端已然成為各類(lèi)AIGC(AI Generated Content)應用的新戰場(chǎng)。
首先,大模型的應用范圍不斷擴展,從圖像生成到文本生成,各類(lèi)應用層出不窮。國內廠(chǎng)商推出的文心一言、智譜清言APP,以及國外的OpenAI移動(dòng)版ChatGPT、Llama 2手機版等,都是大模型在手機上的典型應用。這使得智能終端逐漸成為大模型應用的新灘頭。
智能終端芯片拼什么
算力
在將大模型引入手機時(shí),算力是首當其沖的問(wèn)題。高通在其《混合AI是AI的未來(lái)》白皮書(shū)中談到:“面對每日超過(guò) 100 億次的搜索量且移動(dòng)端搜索占比超過(guò) 60%的情況,生成式 AI 的應用將推動(dòng)所需算力的實(shí)質(zhì)性增長(cháng),尤其是來(lái)自智能手機端的搜索請求。由于基于生成式 AI 的查詢(xún)能夠提供更令人滿(mǎn)意的答案,用戶(hù)的搜索方式已經(jīng)開(kāi)始發(fā)生轉變?!备咄ǖ牡谌旪?移動(dòng)平臺通過(guò)強調硬件加速器,如Hexagon NPU,實(shí)現在手機上運行100億參數大模型。此外,它還改進(jìn)了傳感器中樞,通過(guò)Sensing Hub有助于大模型在手機端的“定制化”,提升了AI處理效率。
內存和能耗
限制大模型進(jìn)入手機的第二道關(guān)卡是有限的內存和電池壓力。聯(lián)發(fā)科表示:“雖然大模型可以帶來(lái)更好的生產(chǎn)力,但本地運行13B的體量就意味著(zhù)需要占用約 13GB 的內存,再加上安卓本身的 4GB和其他APP內存,已經(jīng)超過(guò)了大多數手機16G的內存容量。天璣 9300 使用的內存硬件壓縮技術(shù),通過(guò)量化和壓縮把大模型的內存占用降低,只有這樣才能讓大多數用戶(hù)在日常跑得起大模型應用?!?/p>
高通在第三代驍龍8中采用LPDDR5X內存,提高了數據傳輸速度和帶寬,支持更大更復雜的AI模型。同時(shí),AI引擎的升級,如Hexagon NPU性能提高了98%,功耗降低了40%,在內存和能耗平衡上實(shí)現了更好的性能。聯(lián)發(fā)科也不甘示弱,天璣 9300 集成了 MediaTek 第七代 AI 處理器 APU 790,專(zhuān)為生成式 AI 而設計,其性能和能效相較上一代得到顯著(zhù)提升,整數運算和浮點(diǎn)運算的性能是前一代的兩倍,功耗降低了45%。
互聯(lián)
目前,AI 已廣泛應用于各種物聯(lián)網(wǎng)垂直領(lǐng)域,包括零售、安全、能源和公共設施、供應鏈和資產(chǎn)管理。AI 依靠近乎實(shí)時(shí)的數據采集和分析改進(jìn)決策質(zhì)量,優(yōu)化運營(yíng)效率,并賦能創(chuàng )新以打造差異化競爭優(yōu)勢。通過(guò)生成式 AI,物聯(lián)網(wǎng)細分領(lǐng)域將進(jìn)一步從 AI 的應用中受益。在高通的Snapdragon Seamless技術(shù)展示了智能終端的互聯(lián)。這一技術(shù)能夠在不同設備之間無(wú)縫傳輸數據,為用戶(hù)提供更加便捷的跨終端操作體驗。這種互聯(lián)不僅使得大模型應用在不同設備之間實(shí)現共享,也為AI解決方案的跨平臺適用性提供了可能。
AIGC手機AP亮眼之處
專(zhuān)注AI任務(wù)處理
移動(dòng)AIGC手機AP相比傳統手機AP更專(zhuān)注于處理AI相關(guān)任務(wù)。例如vivo的自研芯片、高通的驍龍平臺以及蘋(píng)果M3都是為了提供更出色的AI推理處理而專(zhuān)門(mén)設計的,突顯了其在A(yíng)I任務(wù)處理方面的專(zhuān)業(yè)性。
多核心異構處理
為了更好地處理不同類(lèi)型和規模的AI模型,移動(dòng)AIGC手機AP可能會(huì )支持多核心異構處理。讓我們簡(jiǎn)單回顧手機處理器到目前為止的提升歷史,初期性能的提升主要是依靠CPU內核架構(比如從Arm Cortex-A5~A15)、提升CPU主頻、同類(lèi)CPU內核數量。但問(wèn)題也隨之浮現, CPU內核性能及數量的提升帶來(lái)的功耗也越來(lái)越大,比如單純的依靠四核A15/A17內核的處理器,如果用到移動(dòng)平臺,都已經(jīng)出現了嚴重的功耗問(wèn)題。而為了解決這一問(wèn)題,Arm在2011年就研發(fā)了全新的big-Little架構,即通過(guò)大核CPU+小核CPU的組合來(lái)平衡性能和功耗問(wèn)題。
在此之后,三星和聯(lián)發(fā)科都一次推出了“大小核”架構的手機處理器,新的變革出現在2017年,Arm正式發(fā)布了全新的有針對人工智能及機器學(xué)習進(jìn)行優(yōu)化的DynamIQ技術(shù)。而新的DynamIQ big-little將允許在單一計算集群上進(jìn)行大小核配置,將可配置性提升到了一個(gè)新的臺階。同時(shí),DynamIQ big.LITTLE還可以對每一個(gè)處理器進(jìn)行獨立的頻率控制以及開(kāi)、關(guān)、休眠三種狀態(tài)的控制,可以實(shí)現在不同任務(wù)間絲滑切換的處理器。2019年,Google博客公布的Pixel Visual Core結構圖中就顯示了AIGC手機AP中需要多核異構,這顆芯片內部集成了8個(gè)圖像處理核心(lmage Processing Unit,簡(jiǎn)稱(chēng):IPU),一顆來(lái)自ARM的A53核心,同時(shí)還擁有MIPI/LPDDR4/PCle控制器。
此后,包括聯(lián)發(fā)科在內的眾多手機芯片廠(chǎng)商開(kāi)始全面采用八核“三叢集”架構設計,很多手機處理器廠(chǎng)商也紛紛效仿。比如,高通最新推出的驍龍8 Gen3采用的就是采1+5+2的八核“三叢集”架構。聯(lián)發(fā)科的天璣9300則首次采用了“全大核”CPU設計,即1個(gè)3.25GHz Cortex-X4超大核+3個(gè)2.85GHz Cortex-X4超大核+4個(gè)主頻2.0GHz Cortex-A720 大核。
更低功耗和高效能
AI 創(chuàng )業(yè)公司 Hugging Face 和卡內基梅隆大學(xué)的研究人員分析了 13 種生成式 AI 任務(wù)的耗能,除了生成圖像和文本,還有摘要、對象檢測、文本分類(lèi)等。每項任務(wù)研究人員都會(huì )運行 1000 個(gè)提示詞,收集期間消耗的電力。結果顯示圖像生成最高,文本分類(lèi)最低。生成圖像的平均耗電量為 0.007 度電(KWh),是文本分類(lèi)的三倍以上(0.002 度電)。
因此,移動(dòng)AIGC手機AP需要在A(yíng)I任務(wù)執行時(shí)提供高效的性能,但同時(shí)要求較低的功耗。這是為了確保在移動(dòng)設備上能夠實(shí)現可持續的性能,同時(shí)維持較長(cháng)的電池壽命。
靈活的軟硬件結合
移動(dòng)AIGC手機AP可能會(huì )支持靈活的軟硬件結合,以便在不同的AI任務(wù)場(chǎng)景下進(jìn)行適應性?xún)?yōu)化。這可以通過(guò)軟件更新來(lái)改進(jìn)AI處理的效能,使手機能夠不斷適應新的AI算法和模型。例如,高通的AI 硬件加速和簡(jiǎn)化開(kāi)發(fā)的軟件解決方案(比如高通 AI 軟件棧),已經(jīng)在引領(lǐng)終端側 AI 推理。聯(lián)發(fā)科則提供了生成式AI開(kāi)發(fā)套件NeuroPilot,支持快速部署生成式AI模型并在A(yíng)PU上高效運行,同時(shí)提供全面的工具鏈以供開(kāi)發(fā)豐富的AI應用程序。
AIGC手機AP的挑戰與機遇
在A(yíng)I模型需求高算力和高功耗的大背景下,智能終端芯片的評判標準已經(jīng)發(fā)生了變化,小模型對處理器提出了更具體的技術(shù)需求,尤其在移動(dòng)端應用場(chǎng)景下。與傳統手機AP相比,移動(dòng)AIGC手機AP更專(zhuān)注于提供高效的AI推理處理,注重多核心異構處理、低功耗和高效能的設計。這種技術(shù)差異使得移動(dòng)設備能夠更好地滿(mǎn)足未來(lái)AI應用對于移動(dòng)終端處理器的不斷提升的需求,為用戶(hù)提供更出色的人工智能體驗。
評論