<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > Softmax 函數和它的誤解

Softmax 函數和它的誤解

發(fā)布人:數據派THU 時(shí)間:2023-06-20 來(lái)源:工程師 發(fā)布文章

來(lái):深度學(xué)習愛(ài)好者 CV技術(shù)指南

[ 導讀 ]Softmax是個(gè)大家都熟悉的激活函數,然而,很多人只知道它的表達式,它在網(wǎng)絡(luò )中的位置,而對一些具體的原因和細節卻回答不上來(lái)。這篇文章給了相應的介紹。 

Softmax 是一個(gè)數學(xué)函數,用于對 0 和 1 之間的值進(jìn)行歸一化。
在本文中,您將了解:

  • 什么是 Softmax 激活函數及其數學(xué)表達式?
  • 它是如何使用 argmax() 函數實(shí)現的?
  • 為什么 Softmax 只用在神經(jīng)網(wǎng)絡(luò )的最后一層?
  • 對 Softmax 的誤解

什么是 Softmax 激活函數及其數學(xué)表達式?


在深度學(xué)習中,使用 Softmax 作為激活函數,對 0 到 1 之間的向量中每個(gè)值的輸出和尺度進(jìn)行歸一化。Softmax 用于分類(lèi)任務(wù)。在網(wǎng)絡(luò )的最后一層,會(huì )生成一個(gè) N 維向量,分類(lèi)任務(wù)中的每個(gè)類(lèi)對應一個(gè)向量。
圖片網(wǎng)絡(luò )輸出層中的 N 維向量
Softmax 用于對 0 和 1 之間的那些加權和值進(jìn)行歸一化,并且它們的和等于 1,這就是為什么大多數人認為這些值是類(lèi)的概率,但這是一種誤解,我們將在本文中討論它。
實(shí)現 Softmax 函數的公式:
圖片
使用這個(gè)數學(xué)表達式,我們計算每類(lèi)數據的歸一化值。這里 θ(i) 是我們從展平層得到的輸入。
計算每個(gè)類(lèi)的歸一化值,分子是類(lèi)的指數值,分母是所有類(lèi)的指數值之和。使用 Softmax 函數,我們得到 0 到 1 之間的所有值,所有值的總和變?yōu)榈扔?1。因此人們將其視為概率,這是他們的誤解。
它如何使用 argmax() 函數?


在對每個(gè)類(lèi)應用上述數學(xué)函數后,Softmax 會(huì )為每個(gè)類(lèi)計算一個(gè)介于 0 和 1 之間的值。
現在我們每個(gè)類(lèi)都有幾個(gè)值,為了分類(lèi)輸入屬于哪個(gè)類(lèi),Softmax 使用 argmax() 給出了應用 Softmax 后具有最大值的值的索引。
圖片argmax 的可視化解釋
為什么 Softmax 只用在神經(jīng)網(wǎng)絡(luò )的最后一層?


現在進(jìn)入重要部分,Softmax 僅用于最后一層以對值進(jìn)行歸一化,而其他激活函數(relu、leaky relu、sigmoid 和其他各種)用于內層。
如果我們看到其他激活函數,如 relu、leaky relu 和 sigmoid,它們都使用唯一的單個(gè)值來(lái)帶來(lái)非線(xiàn)性。他們看不到其他值是什么。
但是在 Softmax 函數中,在分母中,它取所有指數值的總和來(lái)歸一化所有類(lèi)的值。它考慮了范圍內所有類(lèi)的值,這就是我們在最后一層使用它的原因。要通過(guò)分析所有的值來(lái)知道Input屬于哪個(gè)類(lèi)。圖片最后一層的 Softmax 激活函數
對 Softmax 的誤解
關(guān)于 Softmax 的第一個(gè)也是最大的誤解是,它通過(guò)歸一化值的輸出是每個(gè)類(lèi)的概率值,這完全錯誤。這種誤解是因為這些值的總和為 1,但它們只是歸一化值而不是類(lèi)的概率。
圖片
在最后一層并不是單獨使用 Sotmax,我們更喜歡使用 Log Softmax,它只是對來(lái)自 Softmax 函數的歸一化值進(jìn)行對數。
Log Softmax 在數值穩定性、更便宜的模型訓練成本和 Penalizes Large error(誤差越大懲罰越大)方面優(yōu)于 Softmax。
這就是在神經(jīng)網(wǎng)絡(luò )中用作激活函數的 Softmax 函數。相信讀完本文后你對它已經(jīng)有了一個(gè)清楚的了解。
原文鏈接:https://medium.com/artificialis/softmax-function-and-misconception-4248917e5a1c



*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>