AI 端側的芯片革命
2025 年,中國開(kāi)了一個(gè)好年。
本文引用地址:http://dyxdggzs.com/article/202502/467276.htm文化市場(chǎng),哪吒 2 爆火,票房已經(jīng)突破了百億,闖入全球電影 TOP 榜,向世界展示了中國市場(chǎng)「恐怖的」消費能力。AI 市場(chǎng),DeepSeek 的橫空出世,更低的算力達到 Chat GPT 的效果,直接刷屏全球熱搜榜。
如果說(shuō) Chat GPT 的出現,讓生成式 AI 走向了云,那么 DeepSeek 則是讓生成式 AI 走向了端。
端側 AI 芯片的「黃金拐點(diǎn)」
科技行業(yè)一直在探索 AI 硬件產(chǎn)品。
從今年「消費電子屆春晚」CES 上來(lái)看非常明確。今年 CES 上的各大公司推出的產(chǎn)品都與 AI 強相關(guān),無(wú)論是通用的 PC,還是手機終端,再到機器人、眼鏡、耳機、手表等等,幾乎每種產(chǎn)品只要存在人機交互的硬件終端,都有廠(chǎng)商嘗試將其與 AI 大模型結合。
但這些探索似乎都不太成功。大模型推出了成百上千種,硬件產(chǎn)品更是成千上萬(wàn)種,但效果不甚了了。究其原因,還是本地 SoC 提供的算力和大模型需要的算力無(wú)法匹配。
ChatGPT 時(shí)代,大模型的蒸餾是很大的問(wèn)題。如果采用云端調用算力完成 AI 推理,就存在三個(gè)問(wèn)題:第一,成本。云端的任何操作都是有成本的,可能不多,幾分人民幣,但總之是要花錢(qián)的。
有手機廠(chǎng)商透露,調用一次云端大模型的平均成本在 1.2 分到 1.5 分人民幣,假設每個(gè)品牌都有上億的用戶(hù)量,每人每天調用 10 次,這其中的算力成本非常驚人。但是如果按次數或月租向用戶(hù)進(jìn)行收費,在功能同質(zhì)化的情況下,用戶(hù)的使用意愿也會(huì )很難保證。
第二,速度。既然是云端完成,那么必然需要進(jìn)行網(wǎng)絡(luò )傳輸,這就導致 AI 在終端的響應速度慢。如果是自動(dòng)駕駛中的汽車(chē),對于當前環(huán)境需要在 10 毫秒內決策,靠著(zhù)云端未免過(guò)于危險。在自動(dòng)駕駛、工業(yè)質(zhì)檢等場(chǎng)景,端側推理延遲能夠降至毫秒級,較云端方案提升 5 倍。
第三,隱私。這是最重要的部分,涉及到醫療和金融等內容,對于用戶(hù)來(lái)說(shuō),端側模型才是最優(yōu)解。
所有人內心都有一個(gè)答案:端側 AI 才是 AI 硬件落地的關(guān)鍵。
小尺寸模型落地端側已經(jīng)開(kāi)始了。
自華為宣布「小藝智能體」接入 DeepSeek-R1 算起,在一周多的時(shí)間里,包括星紀魅族、榮耀、OPPO、努比亞、vivo 在內的 6 家手機廠(chǎng)商宣布接入 DeepSeek。
需要解釋的是,滿(mǎn)血版 DeepSeek-R1 模型參數達到 671B,僅模型文件就需要 404GB 存儲空間,任何一種移動(dòng)設備都無(wú)法滿(mǎn)足這樣的硬件配置需要。但 DeepSeek 蒸餾版本(1.5B、7B)適合手機等端側使用。
為了讓這些小尺寸模型在端側流暢運行并充分發(fā)揮其智能優(yōu)勢,就需要性能強勁的端側 AI 芯片來(lái)提供算力支持。
市場(chǎng)對于能適配小尺寸模型運行的端側 AI 芯片需求開(kāi)始水漲船高。
賽道主力玩家
端側的應用市場(chǎng)非常大,前文我們提到,只要存在人機交互的硬件終端,都有廠(chǎng)商嘗試將其與 AI 大模型結合。我們可以在這里具體看一下:
AI PC 領(lǐng)域,2027 年 AI PC 在中國 PC 市場(chǎng)占比能夠達到 85%;AI 手機領(lǐng)域,2026 年,AI 手機的出貨量預計將突破 4.7 億部,滲透率增至 38%;在 AI 可穿戴設備領(lǐng)域,市場(chǎng)規模預計將從 2024 年的 419 億美元增長(cháng)至 2028 年的 1207 億美元,CAGR 達到 30.3%。
2023 年中國端側 AI 市場(chǎng)規模為 1,939 億元,從 2018 至 2023 年,其年均復合增長(cháng)率為 116.3%。
DeepSeek 首先帶動(dòng)是 AI 端側的 SoC 芯片需求。
SOC 芯片是各類(lèi)型硬件設備的主控單元,承載著(zhù)運算控制等核心功能,是硬件的「大腦」。隨著(zhù) AI 在邊緣側的應用越來(lái)越廣泛,SOC 將更加變成集成人工智能和邊緣計算能力的系統級芯片,成為 AI SOC,算力達到幾十甚至數百 TOPS。
在這次端側 AI 熱潮中,瑞芯微頻頻漲停。
目前,瑞芯微能夠提供從 0.2TOPs 到 6TOPs 的不同算力水平的 AIoT 芯片,其中 RK3588、RK3576 帶有 6TOPs NPU 處理單元,能夠支持端側主流的 0.5B~3B 參數級別的模型部署??赏ㄟ^(guò)大語(yǔ)言模型實(shí)現翻譯、總結、問(wèn)答等功能,并可實(shí)現多模態(tài)搜索、識別,有效解決不同 AIoT 場(chǎng)景的痛點(diǎn),提升產(chǎn)品使用體驗。
其中,公司 SOC 芯片拳頭產(chǎn)品 RK3588M 是國內少數能媲美國外一線(xiàn)產(chǎn)品的智能座艙 SoC 芯片。
據瑞芯微透露,該產(chǎn)品性能優(yōu)異,一芯帶多屏、端側 AI 等能力突出,已落地應用于眾多頭部車(chē)廠(chǎng),量產(chǎn)車(chē)型 10 余款,超 20 款定點(diǎn)車(chē)型項目在同步開(kāi)發(fā)中。此外,新產(chǎn)品 RK3576M 也正在進(jìn)行客戶(hù)導入。
這還僅是瑞芯微端側 AI 產(chǎn)品應用的一個(gè)方面。
事實(shí)上,當前已有多個(gè)領(lǐng)域的客戶(hù)基于瑞芯微主控芯片研發(fā)在端側支持 AI 大模型的新硬件,例如教育平板、AI 玩具、桌面機器人、算力終端、會(huì )議主機等產(chǎn)品。
全志科技也是一家備受關(guān)注的 SoC 企業(yè)。去年公司全年實(shí)現屬于上市公司股東的凈利潤為 1.53 億元–1.9 億元,同比增長(cháng) 566.29%~727.42%。業(yè)績(jì)暴增的原因,則是以?huà)叩貦C器人、智能投影等業(yè)務(wù)線(xiàn)為代表的產(chǎn)品出貨量顯著(zhù)提升,致使營(yíng)業(yè)收入同比增長(cháng)約 35%。
在記者問(wèn)詢(xún)全志科技產(chǎn)品是否能適配 DeepSeek,是否針對 DeepSeek 進(jìn)行布局時(shí),全志科技表示:「公司產(chǎn)品可以為端側多種形態(tài)的智能終端產(chǎn)品提供算力支持?!?/span>
樂(lè )鑫科技 SoC 長(cháng)期應用于泛 IoT 領(lǐng)域。從應用端看,樂(lè )鑫科技在智能家居、智能照明和消費電子等核心應用市場(chǎng)合計達到了 30% 以上的增長(cháng)。
樂(lè )鑫科技 ESP32-S3 和 ESP32-P4 產(chǎn)品線(xiàn)都有添加邊緣 AI 的功能,主要體現為設備端語(yǔ)音喚醒與控制,以及圖像處理的功能。這兩個(gè)系列的芯片在硬件設計上增加了 AI 加速指令;而在軟件層面,也提供圖像識別和語(yǔ)音喚醒、控制等方案。
樂(lè )鑫科技副總經(jīng)理王玨表示:「公司帶端側 AI 功能的 AIoT 芯片 ESP32-S3 目前增長(cháng)非常迅速,也是當前主推的旗艦產(chǎn)品?!棺止澨鴦?dòng)的 AI 玩具「顯眼包」中用的也是樂(lè )鑫的芯片 ESP32。
晶晨股份已有超 15 款商用芯片搭載其自研的端側 AI 算力單元,2024 年攜帶自研端側 AI 算力單元的芯片出貨量超過(guò) 800 萬(wàn)顆。
2024 年年度實(shí)現營(yíng)業(yè)收入 59.21 億元左右;歸母凈利潤約 8.2 億元左右,同比增長(cháng) 64.65% 左右。該公司表示,其 6nm 芯片 S905X5 系列可利用端側 AI 能力,實(shí)現本地同聲翻譯、同聲字幕等功能,商用半年以來(lái)取得多個(gè)國際 Top 級運營(yíng)商的訂單,預計 6nm 芯片有望在 2025 年達成千萬(wàn)顆以上的銷(xiāo)量。
端側的 AI 音頻處理器應用場(chǎng)景多是在智能物聯(lián)網(wǎng)領(lǐng)域。比如,在智能音響中,端側 AI 音頻處理器能夠支持語(yǔ)音喚醒、語(yǔ)音識別、語(yǔ)音合成等功能,實(shí)現用戶(hù)與音箱的自然語(yǔ)言交互。在智能家居系統中,它可用于聲音控制家電設備,如通過(guò)語(yǔ)音指令調節燈光、空調、電視等。
恒玄科技的端側 SoC 已經(jīng)成功搭載在多家主流品牌產(chǎn)品里,包括百度、字節跳動(dòng)、谷歌、哈曼、安克創(chuàng )新、漫步者、韶音等。今年,字節跳動(dòng)推出的首款搭載豆包大模型的智能耳機 Ola Friend,搭載的就是恒玄科技 2700 芯片。恒玄科技的最新芯片 BES2800 還被應用于三星 2024 年最新發(fā)布的 Galaxy Buds3 Pro 耳機中。多款耳機的應用,能夠看出恒玄科技在智能終端 SoC 芯片領(lǐng)域處于領(lǐng)先地位。
對于端側 AI 對于芯片要求的變化,恒玄科技認為:「云端大模型的興起除了對 AI 手機、PC 帶動(dòng)外,可穿戴也是會(huì )受益于端側 AI 的發(fā)展,它對芯片會(huì )提出新的需求,比如可穿戴的環(huán)境感知能力要變得更強,所以主控芯片的算力需要相應提升,同時(shí)可穿戴產(chǎn)品長(cháng)續航是剛需,所以芯片在算力提升的基礎上還要保持較低的功耗水平?!?/span>
值得一提的還有 AI 眼鏡芯片。行業(yè)普遍認為眼鏡是目前最火的 AI、大模型的落地載體,今年行業(yè)將會(huì )完成 0 到 1 的突破。
之前在 2017 年,Meta 就開(kāi)始自研 AI 眼鏡,最開(kāi)始是和三星合作,但是三年都沒(méi)出什么結果,然后告吹了。之后 Meta 放棄了自研芯片,Ray-Ban 眼鏡使用了高通的 AR1 Gen 1 芯片。
可以說(shuō),在 ARVR 芯片這個(gè)領(lǐng)域,高通還是處于絕對的控制地位。在市面上,AI 眼鏡能用上的芯片,除了高通芯片,那就是紫光展銳的 TW517。
紫光展銳TW517 采用 12nm 工藝,GPU 型號為 IMG8300,運行頻率 800MHz。主要客戶(hù)是閃極 AI 拍拍鏡、影目科技。
同時(shí),恒玄科技此前透露,該公司芯片已在魅族等智能眼鏡產(chǎn)品中應用發(fā)布,同時(shí)有一些客戶(hù)項目正在導入階段。
結語(yǔ)
哪吒 2 突破百億票房,向世界展示了中國市場(chǎng)「恐怖的」消費能力。這意味著(zhù):?jiǎn)螒{中國市場(chǎng)的規模和消費能力就抵得上全球其他發(fā)達國家的總和。
這背后傳遞的信號非常積極。
如果只看電影市場(chǎng),可能還不太理解。但如果放到科技和制造業(yè)中來(lái)看就會(huì )明白其中的巨大價(jià)值。
接下來(lái)不管歐美再怎么對我們進(jìn)行貿易和科技壁壘,都不可能阻止我們產(chǎn)業(yè)升級。對于科技和制造的最大障礙,并不是「卡脖子」,而是前期沒(méi)有足夠大的消費市場(chǎng)買(mǎi)單,就無(wú)法形成相關(guān)產(chǎn)業(yè)鏈的建立。
舉個(gè)例子,某企業(yè)研發(fā)一款芯片,從設計到量產(chǎn)累計成本要 2 個(gè)億,如果只賣(mài)出十萬(wàn)片那每個(gè)芯片的成本等于是 2000 塊,這個(gè)價(jià)格太高了,企業(yè)肯定無(wú)法盈利。只能陷入長(cháng)期虧損,最終倒閉出局。但是如果能夠賣(mài)出 1 億片,那每片成本只需要 2 塊錢(qián)。這個(gè)成本的大幅度攤薄就會(huì )讓企業(yè)有利潤繼續投入研發(fā)。
因為市場(chǎng)體量足夠大,有足夠多的買(mǎi)家幫助消化成本,公司就能賺錢(qián)、行業(yè)就能發(fā)展,這就是中國市場(chǎng)的魔力。
國信證券研報觀(guān)點(diǎn)稱(chēng),2024 年電子行情由「周期復蘇」向「成長(cháng)創(chuàng )新」切換,2025 年行業(yè)有望邁入估值擴張大年。應用端 AI 革新人機交互,以語(yǔ)音交互為核心的 AI 端側應用正處在大規模商業(yè)化的臨界點(diǎn),創(chuàng )新催化頻繁。
相比 AI 云側,國內半導體企業(yè)將在 AI 端側創(chuàng )新中實(shí)現更高的市場(chǎng)參與度,同時(shí)國產(chǎn)半導體自給率仍偏低,兩者共振奠定了行業(yè)成長(cháng)的確定性和空間。
評論