超越 SoC 范式:下一代移動(dòng) AI 芯片將走向何方?
圍繞 ChatGPT 的熱度已經(jīng)開(kāi)啟了生成 AI 的新時(shí)代。這種新鮮的技術(shù)旋風(fēng)正在徹底改變一切,從基于云的人工智能服務(wù)器一直到智能手機的邊緣計算。
鑒于生成式 AI 具有培育新應用和提高用戶(hù)生產(chǎn)力的巨大潛力,智能手機已成為 AI 技術(shù)的重要工具也就不足為奇了。盡管終端設備的計算能力無(wú)法與云相提并論,但它具有降低總體計算成本和保護用戶(hù)隱私的雙重好處。這就是智能手機 OEM 幾年前開(kāi)始使用 AI 芯片探索和實(shí)現新功能的主要原因。
不過(guò),近期 Oppo 關(guān)閉其芯片設計公司哲庫的決定,讓智能手機 OEM 廠(chǎng)商自研芯片的未來(lái)產(chǎn)生了一些疑慮,智能手機 AI 芯片市場(chǎng)成為焦點(diǎn)。
急需加速 AI 芯片迭代
業(yè)界目前在終端設備上運行生成式 AI 模型的方法包括兩個(gè)方面:軟件側重于減小模型的大小以減輕芯片的負擔和能耗,而硬件側則致力于提高計算能力和優(yōu)化通過(guò)流程收縮和架構升級來(lái)減少能源使用。
IC 設計公司,如高通及其 Snapdragon8 Gen.2,現在正加緊開(kāi)發(fā)能夠運行這些生成式 AI 基礎模型的 SoC 產(chǎn)品。
不過(guò),這是棘手的部分:模型以遠遠超過(guò) SoC 開(kāi)發(fā)周期的速度不斷發(fā)展——像 GPT 這樣的更新每六個(gè)月進(jìn)行一次。硬件迭代和新的 AI 模型進(jìn)步之間的差距可能只會(huì )越來(lái)越大,使得計算需求的快速擴展成為硬件解決方案提供商需要解決的主要痛點(diǎn)。
頂級 OEM 開(kāi)創(chuàng )了附加 AI 加速器
很明顯,在這場(chǎng) AI 計算能力的競賽中,過(guò)去對 SoC 的依賴(lài)正在受到挑戰。頂級智能手機 OEM 不再僅僅依賴(lài) SoC 供應商的標準產(chǎn)品。相反,他們正在積極采用 AI 加速器芯片來(lái)填補計算空白。
集成和附加 AI 加速器的方法最早見(jiàn)于 2017 年:
集成:該策略的代表是華為的 Kirin970 和 Apple 的 A11 Bionic,它們在 SoC 中集成了 AI 引擎。
Add-on:最初由 Google Pixel 2 實(shí)現,它使用定制的 Pixel Visual Core 芯片和 Snapdragon 835。直到 2021 年的 Pixel 6 系列引入了 Google 自研的 Tensor SoC,才直接集成了加速單元進(jìn)入張量。
顯然,具備自研 SoC+能力的 OEM 廠(chǎng)商,通常會(huì )在設計階段就將其模型嵌入到 AI 加速器中。這種硬件-軟件協(xié)同作用為特定的 AI 場(chǎng)景提供所需的計算能力。
史詩(shī)般的戰斗:崛起的新戰略模式
對于沒(méi)有自主研發(fā)能力的 OEM 廠(chǎng)商來(lái)說(shuō),SoC 開(kāi)發(fā)的高昂成本讓他們不得不依賴(lài)芯片廠(chǎng)商的 SoC 迭代。然而,他們還在供應鏈中應用新戰略以跟上快速變化的步伐。
這是有趣的部分,品牌正在利用更簡(jiǎn)單的專(zhuān)用芯片來(lái)推動(dòng)支持 AI 的應用程序,使像 ISP(圖像信號處理器)這樣的獨立 IC 成為攝影和顯示新功能的關(guān)鍵。與此同時(shí),我們也看到了生產(chǎn)力工具領(lǐng)域的潛在進(jìn)步,從語(yǔ)音助手到照片編輯人們認真考慮實(shí)施小型 ASIC 來(lái)滿(mǎn)足計算需求。
從小米與 Altek 的合作以及 Vivo 與 Novatek 共同開(kāi)發(fā) ISP 來(lái)看,ASIC 開(kāi)發(fā)的前景一片光明,為小型 IC 設計和 IP 服務(wù)提供商打開(kāi)了機會(huì )。
為應對這一趨勢,SoC 領(lǐng)導者聯(lián)發(fā)科正在采用開(kāi)放式 5G 架構戰略,通過(guò)許可和定制服務(wù)擴展市場(chǎng)。不過(guò),有猜測稱(chēng),OEM 可能會(huì )用自主開(kāi)發(fā)的 IP 取代聯(lián)發(fā)科的標準 IP,以實(shí)現更深層次的產(chǎn)品差異化。
如此看來(lái),AI 芯片之爭顯然還在繼續,智能手機 AI 芯片產(chǎn)品加速迭代并無(wú)勝算。
人工智能服務(wù)器的高成本和復雜性不可避免地限制了其開(kāi)發(fā)僅限于大型制造商。HPE 和戴爾這兩家領(lǐng)先的公司采取了不同的策略進(jìn)入市場(chǎng):
HPE 不斷加強與谷歌的合作,計劃到 2022 年將所有產(chǎn)品轉化為服務(wù)形式。它還于 2023 年 1 月收購了初創(chuàng )公司 Pachyderm,推出基于云的超級計算服務(wù),讓訓練和開(kāi)發(fā)大型模型變得更加容易。
2023 年 3 月,戴爾推出了最新的 PowerEdge 系列服務(wù)器,提供配備 NVIDIA H100 或 A100 Tensor Core GPU 和 NVIDIA AI Enterprise 的選項。他們采用第四代英特爾至強可擴展處理器,引入戴爾軟件 Smart Flow,滿(mǎn)足數據中心、大型公有云、人工智能、邊緣計算等不同需求。
隨著(zhù) AIGC 應用程序市場(chǎng)的蓬勃發(fā)展,我們似乎離以完全虛擬化內容為中心的未來(lái)元宇宙又近了一步。然而,硬件基礎設施是否能跟上激增的需求仍不明朗。這種持久的挑戰將繼續考驗云服務(wù)器制造商平衡成本和性能的能力。
考慮到芯片開(kāi)發(fā)所需的大量資源和智能手機市場(chǎng)的飽和,保持芯片相關(guān)戰略為 OEM 增加了一層不確定性。隨著(zhù) Oppo 停止芯片研發(fā),其他品牌如 vivo 和小米可能會(huì )重新考慮他們的游戲計劃,因此,未來(lái)值得密切關(guān)注。
評論