<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > CVPR 2022 | 這個(gè)自蒸餾新框架新SOTA，降低了訓練成本，無(wú)需修改網(wǎng)絡(luò )

CVPR 2022 | 這個(gè)自蒸餾新框架新SOTA，降低了訓練成本，無(wú)需修改網(wǎng)絡(luò )

發(fā)布人：機器之心時(shí)間：2022-04-09 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

OPPO 研究院聯(lián)合上海交通大學(xué)提出的新的自蒸餾框架DLB，無(wú)需額外的網(wǎng)絡(luò )架構修改，對標簽噪聲具有魯棒性，并可大幅節約訓練的空間復雜度，在三個(gè)基準數據集的實(shí)驗中達到了 SOTA 性能。

深度學(xué)習促進(jìn)人工智能（AI）領(lǐng)域不斷發(fā)展，實(shí)現了許多技術(shù)突破。與此同時(shí)，如何在有限硬件資源下挖掘模型潛能、提升部署模型的準確率成為了學(xué)界和業(yè)界的研究熱點(diǎn)。其中，知識蒸餾作為一種模型壓縮和增強的方法，將泛化能力更強的「大網(wǎng)絡(luò )模型」蘊含的知識「蒸餾」到「小網(wǎng)絡(luò )模型」上，來(lái)提高小模型精度，廣泛地應用于 AI 領(lǐng)域的全監督、半監督、自監督、域遷移等各個(gè)方向。

近日， OPPO 研究院聯(lián)合上海交通大學(xué)將視角聚焦到知識蒸餾的范式本身，提出了新的自蒸餾框架：DLB（Self-Distillation from Last Mini-Batch），模型無(wú)需額外的網(wǎng)絡(luò )架構修改，對標簽噪聲具有魯棒性，并大幅節約訓練的空間復雜度。此外，在三個(gè)基準數據的實(shí)驗中，模型達到了 SOTA 性能。相關(guān)論文「Self-Distillation from the Last Mini-Batch for Consistency Regularization」已被 CVPR 2022 收錄。

論文鏈接：https://arxiv.org/pdf/2203.16172.pdf

DLB 自蒸餾框架

如何減少蒸餾計算復雜度？

知識蒸餾通?？梢詣澐譃槿?lèi)，即離線(xiàn)蒸餾、在線(xiàn)蒸餾和自蒸餾。其中，自蒸餾具有訓練輕量、知識遷移效率高的特點(diǎn)，最近受到更多研究者的重視。

圖 1：本文方法與其他自蒸餾方法的比較

但是傳統的自蒸餾，例如 Be Your Own Teacher，在模型訓練過(guò)程中需要對模型結構進(jìn)行修改。除此以外，訓練成本高、計算冗余且效率低下也是自蒸餾需要攻克的難題。

為了解決上述難題，讓模型更好地部署到手機等終端設備中，OPPO 研究院和上海交通大學(xué)的研究員們提出了 DLB 自蒸餾框架。利用訓練時(shí)前后 Batch 預測結果的一致性，在無(wú)需對模型進(jìn)行網(wǎng)絡(luò )結構修改的前提下，就能降低訓練復雜度，增強模型泛化能力。

1. 本文的任務(wù)

提出更加輕量的自蒸餾方式，降低訓練的計算復雜度，提高模型準確率和泛化性。

2. 本文創(chuàng )新與貢獻

提出 DLB，通過(guò)保存與下個(gè) Batch 部分樣本重疊的軟目標（soft targets）進(jìn)行自蒸餾。節省計算內存，并且簡(jiǎn)化訓練流程。
讓訓練樣本的每次前向過(guò)程都與一次反向傳播過(guò)程相關(guān)聯(lián)，從而提升學(xué)習效率。
實(shí)驗分析了 DLB 訓練方法的動(dòng)態(tài)影響，發(fā)現其正則化效果來(lái)源于即時(shí)生效的平滑標簽帶來(lái)的訓練一致性，為自蒸餾的理論研究提供了實(shí)驗基礎。

DLB 自蒸餾框架訓練機制

DLB 在訓練階段的每個(gè) iteration 中，目標網(wǎng)絡(luò )扮演著(zhù)「教師」和「學(xué)生」的雙重角色。其中，教師的作用是生成下一個(gè) iteration 的軟目標進(jìn)行正則化；學(xué)生的作用是從前一個(gè) iteration 平滑的標簽中蒸餾，并最小化監督學(xué)習目標。

數據集定義為，包含 n 個(gè)樣本的 Batch 定義為：，以圖像分類(lèi)為例，圖片先進(jìn)行數據增強，然后將其輸入神經(jīng)網(wǎng)絡(luò )，優(yōu)化預測輸出與真值間的交叉熵損失：

上式中 p_i 的表達式如下：

θ為網(wǎng)絡(luò )參數，K 表示分類(lèi)類(lèi)別數，τ表示溫度。

為了提高泛化能力，傳統的 vanilla 知識蒸餾通過(guò)額外優(yōu)化的 KL 散度損失來(lái)遷移預先訓練好的 teacher 網(wǎng)絡(luò )的知識，即：

不同于以往采用預先訓練 teacher 模型的方式生成(P_i^τ ) ?，DLB 采用訓練中前一個(gè) Batch 蘊含的信息生成(P_i^τ ) ?，并將其作為正則化的即時(shí)平滑標簽。

圖 2：DLB 訓練方式示意圖

如圖 2 所示，數據樣本在第 t 次迭代時(shí)的定義為，神經(jīng)網(wǎng)絡(luò )的參數為θ_t。

B_t 和 B_(t-1)是通過(guò)使用數據采樣器獲得，在前向過(guò)程后計算 L_CE。每個(gè)小批次的一半限制為與上一個(gè) iteration 一致，其余一半與下一個(gè) iteration 一致。之后，前半部分小批次利用上一個(gè) iteration 中生成的動(dòng)態(tài)軟目標進(jìn)行學(xué)習。即由 t-1 次迭代的軟標簽（soften labels）生成。因此，引入的正則化損失公式如下：

存儲平滑標簽只需要很少的額外內存成本，所以帶來(lái)的額外計算成本很低。整體損失函數由下式表示：

綜上，DLB 算法整體的訓練的偽代碼如下所示：

實(shí)驗設置

研究員們采用三個(gè)圖像分類(lèi)基準數據集評估性能，包括 CIFAR-10、CIFAR-100TinyImageNet。實(shí)驗結果都達到了最佳性能，如下表所示：

具體而言，在平均錯誤率層面， DLB 在 CIAFR-100 改進(jìn)幅度為 0.83% 至 2.50%，在 CIFAR-10 上為 0.37% 至 1.01%，在 TinyImageNet 上為 0.81% 至 3.17。值得一提的是，DLB 的表現明顯優(yōu)于 Tf-KD 和 PS-KD，這證明了 DLB 在模型泛化提升上的優(yōu)勢。

為了評估 DLB 與基于數據增強正則化方法的兼容性，研究員在 CIFAR-10 和 CIFAR-100 上將 DLB 與 CutMix、CutOut 和 DDGSD 相結合。如下所示，實(shí)驗表明通過(guò)結合 DLB 和基于增強的正則化，可以實(shí)現額外的性能增益。

為了證明魯棒性，研究員在訓練之前向 CIFAR-100、CIFAR-10 隨機注入標簽噪聲，實(shí)驗結果如下圖所示，DLB 可以有效地抵抗標簽噪聲并提高整體性能。

結語(yǔ)

本文提出了一種基于自蒸餾思想的深度學(xué)習訓練策略，將自蒸餾思想融入到模型訓練過(guò)程中，對傳統知識蒸餾進(jìn)行改進(jìn)，無(wú)需額外預先訓練 teacher 的過(guò)程。通過(guò)在三個(gè)基準數據集上進(jìn)行實(shí)驗，多維度論證了 DLB 訓練策略的有效性與普適性。

當下，深度學(xué)習網(wǎng)絡(luò )模型結構復雜度不斷提升，使用有限硬件資源開(kāi)發(fā)和部署 AI 模型成為新的科研問(wèn)題。在本文中，研究員設計的 DLB 訓練策略，在某種程度上解決了「不增加模型復雜度，提高模型準確率」這一業(yè)界難題。

未來(lái)，OPPO 將持續研發(fā)該算法，并將其賦能到相關(guān)業(yè)務(wù)場(chǎng)景中，不斷提升 OPPO 產(chǎn)品的用戶(hù)體驗。

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

伺服電機相關(guān)文章:伺服電機工作原理

電容式接近開(kāi)關(guān)相關(guān)文章:電容式接近開(kāi)關(guān)原理
接近開(kāi)關(guān)相關(guān)文章:接近開(kāi)關(guān)原理

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

釋說(shuō)芯語(yǔ)16：硬科技：構建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺電腦... 一臺來(lái)創(chuàng )建AI... 一臺來(lái)模擬AI... 一臺來(lái)運行AI”

智能計算 AI | 2024-07-31

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

iPhone 16將不會(huì )預裝AI功能？計劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

蘋(píng)果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

CSR8670CSR8675智能語(yǔ)音Alexa藍牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

如何快速搭建手寫(xiě)體識別演示系統

視頻 digikey AI 手寫(xiě)體識別 | 2022-07-29

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠(chǎng)的生產(chǎn)力

winni945 | 2018-09-12

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

AI+機器視覺(jué)成趨勢，圖文詳解N大應用場(chǎng)景

智能計算安森美 AI 機器視覺(jué) | 2024-07-31

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>