智能手機AI的下半場(chǎng) 從扁平到立體
自去年以來(lái),手機行業(yè)最熱的名詞必是“AI”無(wú)疑。AI,即人工智能,英文Artificial Intelligence,又稱(chēng)機器智能(Machine Intelligence)。顧名思義,這是機器展現出來(lái)的智能,區別于人或動(dòng)物的自然智能(Natual Intelligence)。
本文引用地址:http://dyxdggzs.com/article/201811/394948.htm

AI作為一個(gè)新技術(shù)被世人知曉,可能是源于兩年前。彼時(shí),谷歌的人工智能棋手“Alpha Go”戰勝?lài)迨澜绻谲娎钍朗粦鸪擅?,人們開(kāi)始了解到AI并寄予這項技術(shù)更多的遐想:AI是否是生產(chǎn)力革命的下一個(gè)“風(fēng)口”?而在科技行業(yè)中,嗅覺(jué)靈敏的手機行業(yè)當然希望牢牢抓住AI這一風(fēng)口,將這一技術(shù)由前端科研下放到消費電子領(lǐng)域,應用到智能手機終端。AI終究更快地走入了人們的生活。
目前看來(lái),AI在智能手機上的應用,分為上半場(chǎng)和下半場(chǎng)。
上半場(chǎng):
自2017年9月2日首款AI手機芯片麒麟970芯片正式發(fā)布,支持到硬件級的AI能力進(jìn)入到手機行業(yè),正式開(kāi)啟智能手機AI化的上半場(chǎng)。在這個(gè)時(shí)間區間內,手機的應用主要是各個(gè)手機廠(chǎng)家在推動(dòng),零散,分裂,水平參差不齊。由于手機廠(chǎng)商的研發(fā)投入與技術(shù)底蘊各不相同,自然對AI的真實(shí)性與可用性也不一而足。
時(shí)至今日,AI技術(shù)已經(jīng)從理論開(kāi)始產(chǎn)品化實(shí)踐,進(jìn)而向消費電子領(lǐng)域全面普及。在手機行業(yè)中,上至旗艦,下到千元機,無(wú)論是拍照還是玩游戲,整個(gè)行業(yè)渴望搶食AI紅利,乃至AI手機從擁有技術(shù)底蘊的公司辛勤研發(fā)的“風(fēng)口”變成哪怕不具備能力的廠(chǎng)家希望能靠營(yíng)銷(xiāo)上位的“風(fēng)噪”。
首先是華為、蘋(píng)果等廠(chǎng)商,憑借專(zhuān)門(mén)的AI硬件與軟件的配合實(shí)現了完成度較高的AI功能,促進(jìn)了行業(yè)的發(fā)展和進(jìn)步。例如華為在硬件上采用麒麟970/980等具有獨立NPU的AI芯片,軟件上通過(guò)集成了AI識別場(chǎng)景、AI翻譯等功能的EUMI系統來(lái)實(shí)現AI功能,方便了用戶(hù)的使用。在過(guò)去的一段時(shí)間里,似乎安卓陣營(yíng)只有華為和榮耀有底氣講自己的產(chǎn)品是名副其實(shí)的AI手機。
另一方面,有一些廠(chǎng)家,則單單憑借一些軟件算法,就稱(chēng)自己的手機為“AI手機”,甚至一些千元機,也是張口閉口“AI拍照”“AI游戲”。但歸根結底,他們鮮有技術(shù)積累,遑論實(shí)現真正的AI功能,自然無(wú)法讓用戶(hù)感覺(jué)到手機變得更加智能;甚至在一定程度上加大了手機行業(yè)營(yíng)銷(xiāo)過(guò)度的“風(fēng)噪”聲量。
那么這里就引入一個(gè)問(wèn)題,所謂的“手機AI”,到底是什么呢?
簡(jiǎn)單來(lái)說(shuō),手機AI就是用專(zhuān)門(mén)的AI芯片識別特定場(chǎng)景并針對性地完成任務(wù)。具體的實(shí)現原理則是以AI芯片對神經(jīng)網(wǎng)絡(luò )模型進(jìn)行深度學(xué)習,進(jìn)而在自然語(yǔ)義理解,圖像識別等場(chǎng)景下工作。
可以理解為,AI的本質(zhì)是運算,當前手機芯片AI運算解決方案主要以獨立處理單元體現。其中獨立處理單元則是在手機處理器中加入深度學(xué)習專(zhuān)用處理器IP。我們熟知的傳統處理器和圖形處理器一般是面向特定部分的應用,不具有向深度學(xué)習方面的優(yōu)化計算能力。而專(zhuān)門(mén)進(jìn)行AI計算的專(zhuān)用處理器則能夠顯著(zhù)提升深度學(xué)習的處理速度和能效,提升能效比。

目前在端側,手機AI最常解決的場(chǎng)景在人臉識別、物體識別、圖像分割、智能翻譯等場(chǎng)景。舉個(gè)例子,你在使用手機拍照時(shí),手機能自動(dòng)識別藍天、人像、動(dòng)物這些具體場(chǎng)景,從而針對不同場(chǎng)景進(jìn)行不同優(yōu)化,都是圖像識別、圖像分割這些看似“高端”的技術(shù)的落地。而對于A(yíng)I,其性能也并非“看不見(jiàn)摸不著(zhù)”。而在蘇黎世聯(lián)邦理工學(xué)院的AI Benchmark測試中,麒麟980獲得了目前安卓手機中的No:1。而在比較經(jīng)典的AI測試場(chǎng)景中,蘋(píng)果A12 Bionic每秒能識別6000張照片。
因此,在近半年發(fā)布的A12 Bionic、麒麟980,以及三星Exynos9820中都加入了獨立的神經(jīng)網(wǎng)絡(luò )處理單元,主流移動(dòng)芯片廠(chǎng)商對于自家的旗艦終端芯片,標志著(zhù)上游供應鏈已經(jīng)完成了硬件上對AI的支持。(在下個(gè)月高通發(fā)布的8150中,據說(shuō)也會(huì )搭載獨立NPU)
從華為開(kāi)創(chuàng )移動(dòng)端人工智能芯片的先河,到如今幾乎所有的主流旗艦級芯片都加入硬件級AI的支持。如果說(shuō)單個(gè)手機廠(chǎng)家自己做AI只是自發(fā)的行為,以致于各家所能實(shí)現的AI水平參差不齊;那么全體芯片廠(chǎng)商從上游的芯片供應來(lái)推動(dòng)手機AI的發(fā)展,就使得硬件級AI將覆蓋未來(lái)幾乎所有的高端旗艦智能手機。至此,智能手機AI的上半場(chǎng)告一段落。
下半場(chǎng):從扁平到立體
盡管得到了上游芯片廠(chǎng)商的支持,但也只是標志著(zhù)手機AI軍備競賽的下半場(chǎng)將正式開(kāi)始。因為當大家在硬件層面都處在同一起跑線(xiàn)的時(shí)候,競爭會(huì )變得多樣化。
如果說(shuō)手機AI 1.0是二維平面,單純依靠智能手機的終端硬件——AI芯片來(lái)在端側實(shí)現;那么如今手機AI 2.0的時(shí)代業(yè)已成為一種三維的通路:面對日益復雜的AI工作場(chǎng)景,需要從芯片、終端再到云端進(jìn)行協(xié)作運算。在這方面,華為的HiAI平臺則跑在了前面。
首先,芯片硬件的AI算力是實(shí)現AI功能的物質(zhì)基礎,AI算力的強弱決定了智能手機執行AI任務(wù)的速度。
以風(fēng)靡全球的Prisma軟件為例。作為第一款結合了人工智能技術(shù)的濾鏡軟件,一經(jīng)問(wèn)世便走紅全球,它的特點(diǎn)在于將用戶(hù)的照片賦予梵高的《星空》等經(jīng)典大作的風(fēng)格。其實(shí)現原理就是AI中的“卷積神經(jīng)網(wǎng)絡(luò )”學(xué)習,在用戶(hù)選擇要添加藝術(shù)濾鏡的原照片后,Prisma軟件便開(kāi)始了“物體識別--紋理合成--風(fēng)格提取--圖片合成”這一系列的工作流程,這其中最難的工作就是物體識別。

在一張集成了錯綜復雜的線(xiàn)條、色彩與光影的照片中,如何較為精準地區分出物體的輪廓?這就回到了卷積神經(jīng)網(wǎng)絡(luò )技術(shù),通過(guò)不斷的訓練與學(xué)習,一步步地對目標圖片中物體進(jìn)行“篩選”和“過(guò)濾”,最后就會(huì )得到較為清晰的物體輪廓,進(jìn)而用算法生成與經(jīng)典畫(huà)作一樣風(fēng)格的照片。因此在進(jìn)行AI任務(wù),如用Prisma軟件修圖時(shí),擁有不同AI算力的智能手機表現也會(huì )有顯著(zhù)的差距。華為麒麟980等集成獨立NPU單元的Soc對于卷積神經(jīng)網(wǎng)絡(luò )運算的支持更加到位,這是由于卷積神經(jīng)網(wǎng)絡(luò )在運算時(shí)需要進(jìn)行大量的并行計算。相比依賴(lài)CPU等進(jìn)行AI運算的芯片,具有獨立NPU的芯片有著(zhù)4倍的速度與僅僅1/50的功耗。
其次,AI功能的落地離不開(kāi)軟件的支持。華為在軟件上打造了一個(gè)完成度非常高的AI閉環(huán)。從打開(kāi)手機開(kāi)始,用戶(hù)可以使用系統層面的智能情景助手和智能語(yǔ)音助手小藝;打開(kāi)相機,可以用AI攝影大師進(jìn)行場(chǎng)景識別并自動(dòng)優(yōu)化拍攝參數;打開(kāi)AI識物可以識別食物的卡路里、搜索看到的商品或者進(jìn)行即時(shí)翻譯,等等……用戶(hù)隨時(shí)隨地都在使用著(zhù)真實(shí)可感的AI服務(wù)。
另外,隨著(zhù)對于復雜AI工作場(chǎng)景的不斷開(kāi)發(fā),必然要實(shí)現終端(智能手機)到云端(服務(wù)器)的協(xié)同計算。因為硬件本身的算力畢竟是有限的,只有借力于云端服務(wù)器,才能實(shí)現更好的AI運算。
譬如當用戶(hù)將鏡頭對準一只不知其種類(lèi)的小狗,終端和云端的AI接力開(kāi)始。終端芯片憑借NPU迅速地識別鏡頭下小狗的各種特征,首先識別出它是一只狗,但可能儲存在手機內部的算法并不知道具體是一只什么狗。此時(shí)云端存儲的不同品種小狗的特征進(jìn)行對比和校驗,最后在屏幕上顯示出小狗的準確種類(lèi)讓用戶(hù)了解,這只是一個(gè)很小的AI協(xié)同工作的場(chǎng)景,但舉一反三,未來(lái)在手機會(huì )做出更多令人期待的功能。

因此在華為HiAI 2.0中,開(kāi)發(fā)了基于 “芯、端、云”三層AI生態(tài),HiAI Foundation芯片能力、HiAI Engine應用能力與HiAI Service服務(wù)能力,以芯、端、云結合的三層開(kāi)放能力滿(mǎn)足開(kāi)發(fā)者的各種需求。在未來(lái),更多成熟的AI應用一定是有賴(lài)于完善的AI計算與開(kāi)發(fā)平臺。打通芯片(硬件)—系統及APP(軟件)—云端(計算)這一完整的通路,才能實(shí)現更好的AI功能。
總結:
如今的智能手機行業(yè)顯然已經(jīng)到了一個(gè)關(guān)鍵的十字路口。處理器性能的單純提高和硬件上的進(jìn)化,在過(guò)去的十年里充當了這個(gè)行業(yè)主要的任務(wù),而在這些基礎性能之上,如今AI已經(jīng)成為智能手機通向未來(lái)的一把鑰匙,在算力和數據的馬太效應之下,會(huì )加速智能手機AI的進(jìn)化速度。對于智能手機來(lái)說(shuō),隨著(zhù)上游芯片廠(chǎng)商的推動(dòng),AI的上半場(chǎng)已經(jīng)逐漸塵埃落定,而下半場(chǎng),哨音已響。
評論