蘋(píng)果、華為接連入局,移動(dòng)AI芯片成為競爭新焦點(diǎn)
近期,蘋(píng)果發(fā)布A11Bionic神經(jīng)引擎、華為發(fā)布麒麟970集成NPU,端側人工智能成為業(yè)內熱點(diǎn),高門(mén)檻的人工智能一夜間要飛入尋常百姓家了,對于智能手機人工智能我們應該抱有怎樣的期待呢?
本文引用地址:http://dyxdggzs.com/article/201711/371030.htm正在被輿論泡沫化的人工智能其實(shí)剛上路
隨著(zhù)互聯(lián)網(wǎng)+的大潮/光環(huán)/紅利的退潮,市場(chǎng)、產(chǎn)業(yè)、投資都需要新熱點(diǎn)。人工智能被稱(chēng)為是未來(lái)十年的熱點(diǎn),是受益于計算能力、大數據集、深度神經(jīng)網(wǎng)絡(luò )領(lǐng)域都在取得了超乎尋常的進(jìn)步,人工智能類(lèi)新興技術(shù)在Gartner2017新興技術(shù)成熟度曲線(xiàn)上快速移動(dòng)。
一個(gè)危險的信號是市場(chǎng)幾乎到了不談AI就是落伍的地步,人工智能投資和輿論正在泡沫化。適度的泡沫利于新興技術(shù)的快速普及與商用化,但當一個(gè)概念被熱炒天花亂墜后,最大的危機在于不落地用戶(hù)可感知性不強。
每個(gè)廠(chǎng)商都在談自己的手機人工智能了,云山霧繞,但更多是只聞樓梯腳步聲,對于最終消費者而言,也許只是其中的一點(diǎn)(畢竟人工智能的范疇太廣),亦或是僅僅是停留在宣傳上再包裝的換湯不換藥。
畢竟,屬于人工智能的時(shí)代才剛剛開(kāi)始。
端側人工智能面臨挑戰,但也有獨特優(yōu)勢,專(zhuān)用硬件AI芯片成為優(yōu)選
現階段AI計算主要通過(guò)深度學(xué)習來(lái)進(jìn)行,分為訓練和推斷兩類(lèi)。訓練主要是云端訓練是根據已知數據尋找模型參數的過(guò)程,主要依賴(lài)于云端海量數據與復雜神經(jīng)網(wǎng)絡(luò )結構,計算量巨大。由于端側缺乏大規模數據,暫缺乏端側模型訓練。而在云端與終端側均可進(jìn)行推斷,推斷是根據已有模型,對具體某個(gè)應用(圖片、語(yǔ)音、翻譯等)在云端/終端側進(jìn)行判斷(大量矩陣運算),并返回結果。
云端AI芯片路線(xiàn)基本確立,GPU用于訓練,FPGA用于推斷,谷歌另辟蹊徑開(kāi)發(fā)ASIC(TPU)可同時(shí)完成訓練和推斷。端側AI芯片則根據不同的終端類(lèi)型,有著(zhù)不同解決方案,GPU、FPGA、ASIC、NPU(SoC中AIASIC)等都有應用。
相比云端訓練及推斷的蓬勃發(fā)展,端智能確實(shí)相對滯后,主要受制于手機側的計算性能,智能手機無(wú)論是體積、供電、散熱和能耗等方面相比云端服務(wù)器計算,在支持AI方面面臨著(zhù)巨大的挑戰。
但是相對于云端的人工智能來(lái)說(shuō),智能終端側部署人工智能在隱私保護、帶寬需求、實(shí)時(shí)性/低延時(shí)、功耗以及體驗等眾多方面又都更有優(yōu)勢。
手機SoC芯片既要不斷追求最好的性能,同時(shí)對每一個(gè)能力的加入又必須用最高的性能密度和最好的能源效率的方式進(jìn)行,這對芯片的設計提出了超高的要求。
考慮到前述功耗、帶寬、性能、可靠性、安全和延遲方面因素,用硬件來(lái)實(shí)現機器學(xué)習和深度學(xué)習,相比軟件+云計算方案更有優(yōu)勢,神經(jīng)網(wǎng)絡(luò )處理成為人工智能手機SoC的關(guān)鍵處理單元是必然趨勢,如同CPU、GPU、音視頻編解碼器一樣,在智能終端側部署人工智能已經(jīng)是大勢所趨
移動(dòng)AI芯片成為競爭新焦點(diǎn),華為、蘋(píng)果目前領(lǐng)先半個(gè)身位,2018年則可能遍地開(kāi)花
人工智能芯片可以稱(chēng)為芯片發(fā)展史上的又一次專(zhuān)業(yè)分化,當初GPU也是這么走過(guò)來(lái)的,主要目標仍是縮短計算時(shí)間、降低計算能耗。
ARM
在年初發(fā)布針對人工智能及機器學(xué)習進(jìn)行優(yōu)化的DynamIQ技術(shù),實(shí)現了在單一計算集群上進(jìn)行大小核配置,對每一個(gè)處理器進(jìn)行獨立的頻率控制以及開(kāi)、關(guān)、休眠狀態(tài)的控制,可以實(shí)現在不同任務(wù)間高效無(wú)縫切換最合適的處理器。將加入針對人工智能的指令集和優(yōu)化庫,下一代ARMV8.2版本的指令集將支持神經(jīng)網(wǎng)路卷積運算,提升通用SoC芯片的人工智能和機器學(xué)習的效率。
最近,英國ImaginaTIon發(fā)布了最新神經(jīng)網(wǎng)絡(luò )加速器PowerVR2NXNNA,相信ARM的專(zhuān)用AI芯片IP大概率會(huì )在2018年面世。
高通
高通在2016年發(fā)布Zeroth平臺時(shí)發(fā)布了神經(jīng)處理引擎SDK包,支持主流的深度學(xué)習框架Caffe、TensorFlow等。同時(shí),高通收購荷蘭機器學(xué)習初創(chuàng )公司Scyfer,投資神經(jīng)科學(xué)初創(chuàng )公司BrainCorp,不斷強化人工智能方面的布局。在華為、蘋(píng)果相繼推出專(zhuān)用AI芯片單元后,高通旗艦芯片實(shí)現AI能力硬化是必然,據傳高通已經(jīng)開(kāi)始設計制造執行神經(jīng)網(wǎng)絡(luò )的專(zhuān)用芯片,焦點(diǎn)可能在于高通是自研還是用哪家的IP。
MTK
據傳,聯(lián)發(fā)科已完成了手機芯片內置AI運算單元的設計,預計2018年上市的HelioP70芯片將內建神經(jīng)網(wǎng)絡(luò )及視覺(jué)運算單元(NeuralandVisualProcessingUnit,NVPU)。
蘋(píng)果
蘋(píng)果iPhone8系列中應用的A11Bionic應用處理器,引入神經(jīng)網(wǎng)絡(luò )處理引擎(NE,NeuralEngine),面向特定機器學(xué)習算法,處理支持新iPhone中3DSensor、人臉識別解鎖、Animoji等功能。
華為
麒麟970設計了HiAI移動(dòng)計算架構,首次集成NPU(NeuralNetworkProcessingUnit)專(zhuān)用硬件處理單元,其AI性能密度大幅優(yōu)于CPU和GPU,基于A(yíng)I實(shí)現智能場(chǎng)景識別與對象識別并進(jìn)行針對性?xún)?yōu)化,提升用戶(hù)拍照效果。
可以大膽推測,在2018-19年,旗艦智能手機支持專(zhuān)用AI芯片是大概率事件,能力具備了,但這并不意味著(zhù)智能手機就真正到了愿景中的人工智能階段。業(yè)內又在尋找基于深度學(xué)習的殺手級APP出現,其實(shí)也許這就是個(gè)偽命題,拍照、面部識別等現有應用體驗的優(yōu)化,更有資格成為首批AI受益應用。
SoC集成專(zhuān)用AI芯片大幅提升計算能力,但移動(dòng)端AI體驗仍任重而道遠
傳統CPU、GPU和DSP本質(zhì)上并非以硬件神經(jīng)元和突觸為基本處理單元,相對于NPU在深度學(xué)習方面天生會(huì )有一定劣勢,在芯片集成度和制造工藝水平相當的情況下,理論上表現將遜色于NPU。
據華為官方宣稱(chēng),麒麟970相較于四個(gè)Cortex-A73核心,在處理同樣的AI應用任務(wù)時(shí),新的異構計算架構擁有大約25倍性能和50倍能效優(yōu)勢。以圖像識別速度為例,麒麟970可達到約2005張/分鐘。
嚴格意義上講,現階段我們或許并不應該期待人工智能產(chǎn)生全新的應用,更多應該期待的是通過(guò)人工智能技術(shù),讓現有的應用效率更高、能效更低、體驗更好。目前最成熟的兩個(gè)AI應用領(lǐng)域是語(yǔ)音識別和圖像識別,而蘋(píng)果和華為的專(zhuān)用AI芯片也均選擇在兩個(gè)領(lǐng)域進(jìn)行突破,提升用戶(hù)最常用應用的體驗。
圖像識別:華為的AI+慧眼、蘋(píng)果的FaceID解鎖
拍照現在用戶(hù)最關(guān)注的體驗,通過(guò)AI提升體驗是個(gè)感知度高的選擇。華為麒麟970通過(guò)AI實(shí)現拍照過(guò)程中場(chǎng)景識別、對象識別然后進(jìn)行智能優(yōu)化。場(chǎng)景識別比如運動(dòng)場(chǎng)景、夜間環(huán)境等,提升優(yōu)化運動(dòng)場(chǎng)景下的定格清晰度與暗光拍照效果。對象識別比如人臉識別,針對不同膚色、帽子、眼睛、口罩、遮擋、側臉等多種復雜的人臉場(chǎng)景進(jìn)行智能檢測,針對性的改善人臉部信息的色彩和補光、人臉追焦的優(yōu)化等。相當于把已有的專(zhuān)業(yè)級拍照模型(知識庫)通過(guò)AI芯片應用于用戶(hù)的拍照過(guò)程中,而無(wú)需再去學(xué)習專(zhuān)業(yè)的拍照技能。
iPhoneX在圖像識別方面的面部識別解鎖極具炫耀性體驗,終端側基于結構光方案建立用戶(hù)臉部3D數據,解鎖比對通過(guò)A11芯片中的神經(jīng)網(wǎng)絡(luò )模塊神經(jīng)引擎(NeuralEngine)進(jìn)行處理。
語(yǔ)音識別:AI降噪提升語(yǔ)音識別率、siri升級版
麒麟970A芯片I降噪是通過(guò)應用人工智能噪聲模型替換傳統的反相技術(shù)消噪模型,抑制非穩態(tài)噪音,增強語(yǔ)音信號,把高速、車(chē)內噪聲大環(huán)境下的語(yǔ)音識別率從80%提升到92%(華為實(shí)驗室官方數據)。
作為普及人工智能的啟蒙應用,siri居功至偉,在新iPhone發(fā)布會(huì )上,Siri相比前幾代也有明顯的提升,想必也用到了蘋(píng)果機器學(xué)習博客中提到的新AI技術(shù),并進(jìn)一步擴展siri的服務(wù)能力。
其他的AI應用體驗,諸如,照片應用的圖像識別,相冊歸類(lèi);聽(tīng)歌推薦,通過(guò)對用戶(hù)聽(tīng)歌記錄的學(xué)習來(lái)調整作出相應的推薦;智能回復/推薦,基于云端知識庫預測用戶(hù)的信息回復與情緒表達;續航優(yōu)化,基于用戶(hù)使用行為的機器學(xué)習進(jìn)行調整電池管理等,都是實(shí)用性很強的AI體驗。
顯然,人們對于人工智能手機的期望不只是這些。整體而言,人工智能技術(shù)是一種基礎能力屬于使能層,集成專(zhuān)用AI芯片,突破的是性能瓶頸,而未來(lái)的AI體驗仍將是應用場(chǎng)景驅動(dòng)。無(wú)論是模型還是知識庫還是基于A(yíng)I應用,都有賴(lài)于生態(tài)合作,有賴(lài)于第三方應用開(kāi)發(fā)者調用AI芯片開(kāi)放的能力進(jìn)行開(kāi)發(fā),進(jìn)而發(fā)揮AI芯片的算力。
展望未來(lái),移動(dòng)芯片的引領(lǐng)制勝法寶則是人工智能、5G兩翼齊飛不瘸腿
1、AI芯片成功的關(guān)鍵是人工智能應用生態(tài)的構建
華為與蘋(píng)果幾乎同時(shí)推出專(zhuān)用AI處理單元芯片,考慮到18個(gè)月的芯片設計周期,需要給華為麒麟芯片點(diǎn)贊。SoC芯片集成專(zhuān)用AI芯片堪稱(chēng)端側人工智能里程碑,并有望快速普及,但只是人工智能的第一步,遠談不上勝利,我看到的更多是挑戰。
未來(lái)AI芯片的競爭,不僅僅取決于芯片廠(chǎng)商自身的技術(shù)研發(fā),更取決于生態(tài)運作能力包括垂直領(lǐng)域的知識庫/模型合作以及第三方應用開(kāi)發(fā)者,看誰(shuí)的生態(tài)能夠提供的應用更豐富、體驗更好。對于華為而言,挑戰更甚于當初在基帶領(lǐng)域的單點(diǎn)突破到不斷引領(lǐng)。
華為顯然意識到了這一點(diǎn),宣稱(chēng)將把麒麟970作為人工智能移動(dòng)計算平臺開(kāi)放給更多的開(kāi)發(fā)者和合作伙伴,提供完善的多應用模式和機器學(xué)習框架的支持,讓開(kāi)發(fā)者可以用自己最習慣的方式獲得麒麟970的AI算力。
對于人工智能的云+端布局而言,谷歌+蘋(píng)果的混合體或許是華為應該學(xué)習的榜樣。
2、SoC芯片通信連接能力的提升不應被AI掩蓋光芒
AI大熱下,通信不再是聚光燈下的焦點(diǎn),但通信連接能力的提升不應被輿論低估和遺忘。以麒麟970為例,10nm工藝、業(yè)界首款支持cat18的SoC,FDDLTE下儀表測試1.2Gbps下載速率、5CC(國內尚看不到有需求,在頻譜更離散的區域有需求比如美國AT&T)、4X4MIMO與256QAM(媒體應該相對熟悉了),放在以往都是大新聞,但是今年幾乎無(wú)人問(wèn)津。
如果跳出移動(dòng)AI芯片領(lǐng)域,在人工智能競爭戰場(chǎng)上,蜂窩連接芯片是英偉達們染指蜂窩智能終端領(lǐng)域蛋糕的最大障礙,自然也就是移動(dòng)SoC芯片商的競爭壁壘。從這個(gè)角度看,未來(lái)智能終端SoC芯片的引領(lǐng)之爭,仍屬于蘋(píng)果(傳在進(jìn)行modem自研)、華為、高通們。
評論