<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 消費電子 > 設計應用 > 理解神經(jīng)網(wǎng)絡(luò )中的Dropout

理解神經(jīng)網(wǎng)絡(luò )中的Dropout

作者：時(shí)間：2018-07-24 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

dropout是指在深度學(xué)習網(wǎng)絡(luò )的訓練過(guò)程中，對于神經(jīng)網(wǎng)絡(luò )單元，按照一定的概率將其暫時(shí)從網(wǎng)絡(luò )中丟棄。注意是暫時(shí)，對于隨機梯度下降來(lái)說(shuō)，由于是隨機丟棄，故而每一個(gè)mini-batch都在訓練不同的網(wǎng)絡(luò )。

本文引用地址：http://dyxdggzs.com/article/201807/383602.htm

過(guò)擬合是深度神經(jīng)網(wǎng)(DNN)中的一個(gè)常見(jiàn)問(wèn)題：模型只學(xué)會(huì )在訓練集上分類(lèi)，這些年提出的許多過(guò)擬合問(wèn)題的解決方案，其中dropout具有簡(jiǎn)單性而且效果也非常良好。

算法概述

我們知道如果要訓練一個(gè)大型的網(wǎng)絡(luò )，而訓練數據很少的話(huà)，那么很容易引起過(guò)擬合，一般情況我們會(huì )想到用正則化、或者減小網(wǎng)絡(luò )規模。然而Hinton在2012年文獻：《Improving neural networks by preventing co-adaptation of feature detectors》提出了，在每次訓練的時(shí)候，隨機讓一半的特征檢測器停過(guò)工作，這樣可以提高網(wǎng)絡(luò )的泛化能力，Hinton又把它稱(chēng)之為dropout。

第一種理解方式是，在每次訓練的時(shí)候使用dropout，每個(gè)神經(jīng)元有百分之50的概率被移除，這樣可以使得一個(gè)神經(jīng)元的訓練不依賴(lài)于另外一個(gè)神經(jīng)元，同樣也就使得特征之間的協(xié)同作用被減弱。Hinton認為，過(guò)擬合可以通過(guò)阻止某些特征的協(xié)同作用來(lái)緩解。

第二種理解方式是，我們可以把dropout當做一種多模型效果平均的方式。對于減少測試集中的錯誤，我們可以將多個(gè)不同神經(jīng)網(wǎng)絡(luò )的預測結果取平均，而因為dropout的隨機性，我們每次dropout后，網(wǎng)絡(luò )模型都可以看成是一個(gè)不同結構的神經(jīng)網(wǎng)絡(luò )，而此時(shí)要訓練的參數數目卻是不變的，這就解脫了訓練多個(gè)獨立的不同神經(jīng)網(wǎng)絡(luò )的時(shí)耗問(wèn)題。在測試輸出的時(shí)候，將輸出權重除以二，從而達到類(lèi)似平均的效果。

需要注意的是如果采用dropout，訓練時(shí)間大大延長(cháng)，但是對測試階段沒(méi)影響。

帶dropout的訓練過(guò)程

而為了達到ensemble的特性，有了dropout后，神經(jīng)網(wǎng)絡(luò )的訓練和預測就會(huì )發(fā)生一些變化。在這里使用的是dropout以p的概率舍棄神經(jīng)元

訓練層面

對應的公式變化如下如下：

沒(méi)有dropout的神經(jīng)網(wǎng)絡(luò )

有dropout的神經(jīng)網(wǎng)絡(luò )

無(wú)可避免的，訓練網(wǎng)絡(luò )的每個(gè)單元要添加一道概率流程。

測試層面

預測的時(shí)候，每一個(gè)單元的參數要預乘以p。

除此之外還有一種方式是，在預測階段不變，而訓練階段改變。

關(guān)于這個(gè)比例我查了不少資料，前面的是論文的結論;后面是keras源碼中dropout的實(shí)現。有博客寫(xiě)的公式不一致，我寫(xiě)了一個(gè)我覺(jué)得是對的版本。

Dropout與其它正則化

Dropout通常使用L2歸一化以及其他參數約束技術(shù)。正則化有助于保持較小的模型參數值。

使用Inverted Dropout后，上述等式變?yōu)椋?/p>

可以看出使用Inverted Dropout，學(xué)習率是由因子q=1−p進(jìn)行縮放。由于q在[0,1]之間，η和q之間的比例變化：

參考文獻將q稱(chēng)為推動(dòng)因素，因為其能增強學(xué)習速率，將r(q)稱(chēng)為有效的學(xué)習速率。

有效學(xué)習速率相對于所選的學(xué)習速率而言更高：基于此約束參數值的規一化可以幫助簡(jiǎn)化學(xué)習速率選擇過(guò)程。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：

評論

相關(guān)推薦

GNU Emacs 基礎知識

資源下載 MIT GNU Emacs 基礎知識 | 2007-02-16

迷你七位數字電位器MCP40D17/8/9

視頻 Microchip 電位器 Microchip模擬產(chǎn)品 | 2012-06-21

請教各位flash高手

woodhead | 2004-12-15

運算放大器產(chǎn)品組合

視頻 Microchip 運算放大器 Microchip模擬產(chǎn)品 | 2012-06-21

GDB調試手冊1

資源下載 GDB 調試手冊 | 2007-02-16

英飛凌推出EPR電子標記電纜組件控制器,為USB-C無(wú)源電纜提供高達54V的過(guò)壓保護

元件/連接器英飛凌電子標記電纜組件控制器 USB-C無(wú)源電纜 EMCA | 2023-10-31

孵蛋溫度控制器(F007)

設計方案孵蛋溫度控制器 | 2009-07-06

[求助]指令預取終止和數據預取終止是怎么產(chǎn)生的？

rf0000 | 2004-12-16

基于A(yíng)D855X的壓力變送器的校準系統

視頻 ADI 壓力變送器 AD855X | 2012-06-20

Littelfuse發(fā)布用于備用電源充電應用的創(chuàng )新電子保險絲超級電容器保護集成電路

元件/連接器 Littelfuse 備用電源充電電子保險絲超級電容器保護集成電路 | 2023-10-31

第102屆中國電子展聚焦半導體核心部件賽道

國際視野中國電子展半導體核心部件 | 2023-10-31

科索(COSEL)推出新一代工業(yè)用超緊湊高效率電源

電源與新能源科索 COSEL 電源 | 2023-10-31

運算放大器簡(jiǎn)介

視頻 Microchip 運算放大器 Microchip模擬產(chǎn)品 | 2012-06-21

利用搭載全域硬2D NoC的FPGA器件去完美實(shí)現智能化所需的高帶寬低延遲計算

嵌入式系統 2D NoC FPGA | 2023-10-31

福迪威將收購電子測試和測量解決方案供應商EA Elektro-Automatik

測試測量福迪威 EA Elektro-Automatik | 2023-10-31

TDK推出首款SMD沖擊電流限制器

元件/連接器 TDK SMD 沖擊電流限制器 | 2023-10-31

單相可控硅過(guò)零觸發(fā)電爐溫控電路(NE555、C302、CD40192)

設計方案單相可控硅觸發(fā) 電爐溫控 NE555 CD40192 | 2009-07-06

gprs AT 指令中文手冊

資源下載 gprs AT 指令中文手冊 | 2007-02-16

MCP3903六通道模擬前端采樣芯片

視頻 Microchip MCP3903 Microchip模擬產(chǎn)品 | 2012-06-21

NE555構成的發(fā)酵罐溫度測警和控制電路

設計方案 NE555 構成發(fā)酵溫度測警控制 | 2009-07-06

貿澤電子開(kāi)售STMicroelectronics配備FPU的STM32H5 Arm Cortex-M33 32位MCU

嵌入式系統貿澤 STMicroelectronics FPU STM32H5 Cortex-M33 MCU | 2023-10-31

x86 下 DMA傳輸4K限制

guigen80 | 2004-12-17

羅德與施瓦茨推出八通道R&S MXO 5,升級下一代示波器

測試測量羅德與施瓦茨 R&S 示波器 | 2023-10-31

GSM模塊中文說(shuō)明書(shū)(PIML)

資源下載 CENTEL GSM模塊 PIML-900/1800 | 2007-02-16

NE555構成的微風(fēng)吊扇溫度控制器

設計方案 NE555 構成微風(fēng) 吊扇溫度控制器 | 2009-07-06

采用溫度／頻率轉換的高精度控溫電路(LM567、NE555)

設計方案采用溫度頻率轉換高精度控溫 LM567 NE555 | 2009-07-06

H9200EM用戶(hù)手冊

資源下載 ARM ARM920T H9200EM 用戶(hù)手冊v | 2007-02-16

雖然這問(wèn)題很沒(méi)水平，但我還是要問(wèn)！謝謝了

xxj12 | 2004-12-15

ZESTRON亮相IGBT封裝技術(shù)與應用論壇

EDA/PCB ZESTRON IGBT封裝 | 2023-10-31

二手嵌入式VIA Eden主板,不用風(fēng)扇

jwlinux | 2004-12-17

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>