<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 綜述：輕量級CNN架構設計（2）

綜述：輕量級CNN架構設計（2）

發(fā)布人：計算機視覺(jué)工坊時(shí)間：2021-09-14 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

· 空洞卷積 (Dilated Convolution)

空洞卷積是針對圖像語(yǔ)義分割問(wèn)題中下采樣會(huì )降低圖像分辨率、丟失信息而提出的一種卷積思路。通過(guò)間隔取值擴大感受野，讓原本3x3的卷積核，在相同參數量和計算量下?lián)碛懈蟮母惺芤?。這里面有個(gè)擴張率(dilation rate)的系數，這個(gè)系數定義了這個(gè)間隔的大小，標準卷積相當于dilation rate為1的空洞卷積，下圖展示的是dilation rate為2的空洞卷積計算過(guò)程，可以看出3×3的卷積核可以感知標準的5×5卷積核的范圍，還有一種理解思路就是先對3×3的卷積核間隔補0，使它變成5×5的卷積，然后再執行標準卷積的操作。

空洞卷積

· 轉置卷積 (Transposed Convolutions)

轉置卷積又稱(chēng)反卷積(Deconvolution)，它和空洞卷積的思路正好相反，是為上采樣而生，也應用于語(yǔ)義分割當中，而且他的計算也和空洞卷積正好相反，先對輸入的feature map間隔補0，卷積核不變，然后使用標準的卷積進(jìn)行計算，得到更大尺寸的feature map。

· 可變形卷積 (deformable convolution)

以上的卷積計算都是固定的，每次輸入不同的圖像數據，卷積計算的位置都是完全固定不變，即使是空洞卷積/轉置卷積，0填充的位置也都是事先確定的。而可變性卷積是指卷積核上對每一個(gè)元素額外增加了一個(gè)h和w方向上偏移的參數，然后根據這個(gè)偏移在feature map上動(dòng)態(tài)取點(diǎn)來(lái)進(jìn)行卷積計算，這樣卷積核就能在訓練過(guò)程中擴展到很大的范圍。而顯而易見(jiàn)的是可變性卷積雖然比其他卷積方式更加靈活，可以根據每張輸入圖片感知不同位置的信息，類(lèi)似于注意力，從而達到更好的效果，但是它比可行變卷積在增加了很多計算量和實(shí)現難度，目前感覺(jué)只在GPU上優(yōu)化的很好，在其他平臺上還沒(méi)有見(jiàn)到部署。

其他算子

· 池化(pooling)

池化這個(gè)操作比較簡(jiǎn)單，一般在上采樣和下采樣的時(shí)候用到，沒(méi)有參數，不可學(xué)習，但操作極為簡(jiǎn)單，和depthwise卷積類(lèi)似，只是把乘累加操作替換成取最大/取平均操作。

· 最大池化和平均池化

最大池化和平均池化

· 全局平均池化

全局平均池化的操作是對一個(gè)維度為(C,H,W)的feature map，在HW方向整個(gè)取平均，然后輸出一個(gè)長(cháng)度為C的向量，這個(gè)操作一般在分類(lèi)模型的最后一個(gè)feature map之后出現，然后接一個(gè)全連接層就可以完成分類(lèi)結果的輸出了。早期的分類(lèi)模型都是把最后一個(gè)feature map直接拉平成C×H×W的向量，然后再接全連接層，但是顯然可以看出來(lái)這個(gè)計算量極大，甚至有的模型最后一個(gè)全連接層占了整個(gè)模型計算量的50%以上，之后由研究人員發(fā)現對這個(gè)feature map做一個(gè)全局平均池化，然后再加全連接層可以達到相似的效果，且計算量降低到了原來(lái)的1/HW。

· 最大向上池化

這個(gè)操作在前面基本概念一節上采樣段落中有描述，故不贅述。

· 全連接計算(Full Connected)

這個(gè)本質(zhì)其實(shí)就是矩陣乘法，輸入一個(gè)(B, iC)的數據，權重為(iC, oC)，那么輸出為(B, oC)，在多層感知機和分類(lèi)模型最后一層常常見(jiàn)到。

全連接結構

· Addition / Concatenate分支

Addition和Concatenate分支操作統稱(chēng)為shortcut，如下圖所示，操作極為簡(jiǎn)單。Addition是在ResNet中提出，兩個(gè)相同維度的feature map相同位置點(diǎn)的值直接相加，得到新的相同維度f(wàn)eature map，這個(gè)操作可以融合之前的特征，增加信息的表達，Concatenate操作是在Inception中首次使用，被DenseNet發(fā)揚光大，和addition不同的是，它只要求兩個(gè)feature map的HW相同，通道數可以不同，然后兩個(gè)feature map在通道上直接拼接，得到一個(gè)更大的feature map，它保留了一些原始的特征，增加了特征的數量，使得有效的信息流繼續向后傳遞。

Add &amp;amp; Concat

· Channel shuffle

channel shuffle是ShuffleNet中首次提出，主要是針對分組卷積中不同組之間信息不流通，對不同組的feature map進(jìn)行混洗的一個(gè)操作，如下圖所示，假設原始的feature map維度為(1,9,H,W)，被分成了3個(gè)組，每個(gè)組有三個(gè)通道，那么首先將這個(gè)feature map進(jìn)行reshape操作，得到(1,3,3,H,W)，然后對中間的兩個(gè)大小為3的維度進(jìn)行轉置，依然是(1,3,3,H,W)，最后將通道拉平，變回(1,9,H,W)，就完成了通道混洗，使得不同組的feature map間隔保存，增強了信息的交互。

channel shuffle

常用激活函數

激活函數的非線(xiàn)性是神經(jīng)網(wǎng)絡(luò )發(fā)揮作用最重要的因素之一，而對于實(shí)際部署，激活函數的實(shí)現也是很重要的一個(gè)方面，實(shí)現的不好對加速效果影響很大，這里主要講幾個(gè)部署當中常見(jiàn)的激活函數。

· ReLU系列

這里主要指常用的ReLU，ReLU6和leaky ReLU。ReLU比較好部署，小于0的部分為0，大于0的部分為原始值，只需要判斷一下符號位就行；ReLU6與ReLU相比也只是在正向部分多了個(gè)閾值，大于6的值等于6，在實(shí)現時(shí)多了個(gè)比較也不算麻煩；而leaky ReLU和ReLU正向部分一樣，都是大于0等于原始值，但負向部分卻是等于原始值的1/10，浮點(diǎn)運算的話(huà)乘個(gè)0.1就好了，如果因為量化要實(shí)現整數運算，這塊可以做個(gè)近似，如0.1用13>>7來(lái)代替，具體實(shí)現方法多種多樣，還算簡(jiǎn)單。

ReLU &amp;amp; LeakyReLU

· Sigmoid系列

這里主要指sigmoid，還有和他相關(guān)的swish:

可以看出，如果按照公式來(lái)實(shí)現sigmoid對低性能的硬件來(lái)說(shuō)非常不友好，因為涉及到大量的exp指數運算和除法運算，于是有研究人員針對此專(zhuān)門(mén)設計了近似的硬件友好的函數h-sigmoid和h-swish函數，這里的h指的就是hardware的意思：

可視化的對比如下圖所示，可以看出在保證精度的同時(shí)又能大大方便硬件的實(shí)現，當然要直接實(shí)現sigmoid也是可以的，畢竟sigmoid是有限輸出，當輸入小于-8或大于8的時(shí)候，輸出基本上接近于-1和1，可以根據這個(gè)特點(diǎn)設計一個(gè)查找表，速度也超快，且我們實(shí)測對精度沒(méi)啥影響。

經(jīng)典輕量化模型

早期比較經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò )，如AlexNet，VGG，GoogleNet(或Inception)，ResNet，DenseNet都是以提升模型在ImageNet數據集上的分類(lèi)精度為主了，很少考慮參數量和計算量的問(wèn)題，他們的主要結構解析起來(lái)也比較簡(jiǎn)單，基本都是由標準卷積(7×7，5×5，3×3和1×1)，Pooling和shortcut操作(Addition / Concatenate)構成，而且以3×3及其以上的卷積核為主，通道數也是動(dòng)輒上千，所以參數量和計算量巨大。后續研究人員慢慢發(fā)現兩個(gè)3×3卷積可以代替一個(gè)5×5卷積的效果，三個(gè)3×3卷積可以代替一個(gè)7×7卷積的效果，大量使用1×1卷積，使用3×3 depthwise conv + pointwise conv(1×1標準卷積)可以代替3×3普通卷積......一系列操作可以減少參數量和計算量，所以下面講述一下一些輕量級神經(jīng)網(wǎng)絡(luò )發(fā)展的歷史，因為這塊很多人都講過(guò)，所以我會(huì )簡(jiǎn)單一些，挑重點(diǎn)說(shuō)說(shuō)。

· SqueezeNet

SqueezeNet是公認的輕量級模型設計最早期的工作之一，作者提出了三種策略來(lái)實(shí)現在保持精度的情況下大大減少當時(shí)主流模型(以AlexNet為例)的計算量和參數量：

1.將模型中一部分的3×3卷積用1×1來(lái)代替，1×1卷積是3×3參數量和計算量的1/9，所以可以大大減少參數量和計算量；

2.減少3×3卷積的輸入通道數，這個(gè)可以通過(guò)在進(jìn)入3×3卷積之前加一個(gè)1×1卷積來(lái)實(shí)現通道數量的減少；

3.將下采樣層的位置往后推，使得模型可以在更大的feature map上進(jìn)行更多的學(xué)習，這一步雖然會(huì )在增加計算量，但是和上面兩個(gè)策略結合可以在維持模型精度的情況下仍大大減少參數量和計算量；

fire module

根據上面的策略，作者提出了fire module的子結構，如下圖所示，然后整個(gè)模型由這樣的子結構堆疊而成。這個(gè)fire module由squeeze部分和expand部分構成，squeeze部分是1×1的卷積層，而expand部分是1×1的卷積和3×3的卷積拼接起來(lái)的，每次feature map輸入這個(gè)fire module會(huì )在squeeze層降低通道數，然后在expand通道增加通道數，從而在參數量更少的情況下仍然可以得到充分的學(xué)習。最后結合一些模型壓縮的方法可以使得SqueezeNet在達到AlexNet同等精度的情況下，參數量減少到后者的1/50，計算量減少到后者的1/510。

這篇論文使用大量1×1的卷積核代替3×3卷積，并且利用1×1卷積改變大尺度卷積層輸入feature map的通道數從而減少計算量的思想是非常有意義的，后續的很多輕量級網(wǎng)路的論文都沿用了這種套路。

MobileNet系列

MobileNet系列一共有V1,V2和V3三篇論文，簡(jiǎn)要的講：

1.MobileNet V1主要思想是提出了一種新的結構—深度可分離卷積(Depthwise Separable Convolution)來(lái)代替標準3×3卷積，從而大大減少模型的參數量和計算量；

2.MobileNet V2在V1的基礎上提出了一種倒置殘差的模塊，這個(gè)模塊有三個(gè)卷積，第一個(gè)部分是一個(gè)1×1標準卷積，用來(lái)升維，第二個(gè)部分是由3×3深度卷積+1×1標準卷積構成的深度分離卷積，用來(lái)學(xué)習特征和降維，模塊的輸出和輸入再進(jìn)行一個(gè)Addition的操作，由于和ResNet中維度升降方式相反，所以稱(chēng)為倒置殘差。中間升維的作用是讓深度可分離卷積得到更充分的學(xué)習，計算量相對于標準卷積來(lái)說(shuō)也不大，而且這種升降維的方式非常靈活，可以大大減少計算量。本文還從流形學(xué)的角度探究了輸入深度可分離卷積上一層的ReLU6對信息傳遞的影響，理論證明去掉上一個(gè)1×1標準卷積的ReLU激活函數能更有利于后面的深度可分離卷積對特征的學(xué)習。

MobileNet V2

3. MobileNet V3感覺(jué)相對于前兩篇沒(méi)有那么大的結構創(chuàng )新了，主要思想是神經(jīng)架構搜索(NAS)和硬件友好結構，總的來(lái)看V3的結構是在V2的基礎上進(jìn)行了一些修改，如增加了SE block這種已被提出的注意力機制，激活函數換成了H-swish，last stage減少了幾層計算，針對語(yǔ)義分割提出了Lite R-ASPP的head(不在討論之列)，整個(gè)論文看著(zhù)像是堆tricks，重點(diǎn)不是很突出，有點(diǎn)年底沖業(yè)績(jì)的嫌疑。

MobileNet V3

根據我自己的比賽和項目經(jīng)驗來(lái)看，還是MobileNet V1和V2的結構比較實(shí)用，參數量和計算量小，可拓展性好，SE block這種模塊對延時(shí)影響還是不小，而且我們發(fā)現其他各種花里胡哨的激活函數跟ReLU/ReLU6相比都差不多，對精度沒(méi)有很大的影響，還不如直接部署ReLU/ReLU6來(lái)的方便。

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠(chǎng)的生產(chǎn)力

winni945 | 2018-09-12

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

如何快速搭建手寫(xiě)體識別演示系統

視頻 digikey AI 手寫(xiě)體識別 | 2022-07-29

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺電腦... 一臺來(lái)創(chuàng )建AI... 一臺來(lái)模擬AI... 一臺來(lái)運行AI”

智能計算 AI | 2024-07-31

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

釋說(shuō)芯語(yǔ)16：硬科技：構建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

蘋(píng)果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

CSR8670CSR8675智能語(yǔ)音Alexa藍牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

AI+機器視覺(jué)成趨勢，圖文詳解N大應用場(chǎng)景

智能計算安森美 AI 機器視覺(jué) | 2024-07-31

iPhone 16將不會(huì )預裝AI功能？計劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>