<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 深度剖析多任務(wù)模型 QAT 策略

深度剖析多任務(wù)模型 QAT 策略

發(fā)布人：地平線(xiàn)開(kāi)發(fā)者時(shí)間：2025-02-23 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

本文為筆者個(gè)人見(jiàn)解，如有不同意見(jiàn)歡迎評論

1.引言

為了節省端側計算資源以及簡(jiǎn)化部署工作，目前智駕方案中多采用動(dòng)靜態(tài)任務(wù)融合網(wǎng)絡(luò )，地平線(xiàn)也釋放了 Lidar-Camera 融合多任務(wù) BEVFusion 參考算法。這種多任務(wù)融合網(wǎng)絡(luò )的浮點(diǎn)訓練策略可以簡(jiǎn)述為：

首先在大量數據的條件下完成多任務(wù)模型 backbone 部分的浮點(diǎn)訓練；

然后，固定 backbone 的權重，分別接多個(gè) task head 進(jìn)行單獨的訓練。

在這種浮點(diǎn)訓練策略下，QAT（量化感知訓練）里的 calibration（校準）和量化訓練策略跟常規的單 task 模型差別較大。常規的單 task 模型一般就是用那種比較固定、普遍適用的訓練辦法，不過(guò)碰到復雜多變又有特定需求的情況，它的局限性就慢慢顯現出來(lái)了。

這篇文章會(huì )結合具體的場(chǎng)景，對 calibration 和量化訓練策略進(jìn)行分析，然后提出一些筆者個(gè)人獨特的看法，希望相關(guān)領(lǐng)域的研究和實(shí)踐提供點(diǎn)有用的參考和啟發(fā)。

2.量化訓練策略

本文將以具有兩個(gè)任務(wù)頭 task_head1 和 task_head_2 的多任務(wù)模型為例進(jìn)行描述。

2.1 步驟描述

此步驟的前提是模型已完成**浮點(diǎn)訓練。**

在進(jìn)行后續操作之前，必須確保模型已經(jīng)成功地完成了浮點(diǎn)訓練。只有在這個(gè)前提條件得到滿(mǎn)足的情況下，才能保證后續的工作能夠順利進(jìn)行，并且得到準確和可靠的結果。

step1:

首先對骨干網(wǎng)絡(luò )（backbone）進(jìn)行校準/量化感知訓練（calibration/qat），在滿(mǎn)足量化精度要求后，保存校準/量化感知訓練的權重（calib/qat 權重）。

step2:

驗證 step1 中 backbone 在部署 head 上的精度，具體操作是對 backbone 進(jìn)行偽量化處理，而 task_head1 和 task_head2 保持浮點(diǎn)計算，然后在驗證集上測試這兩個(gè) head 的精度。

step3:

若 step2 驗證出的 task_head1 精度不符合預期，則說(shuō)明 backbone 的偽量化對 task_head1 的浮點(diǎn)精度不夠友好，所以需要對模型做以下調整，具體操作方案如下：

對部署的 task_head1 和 task_head2 做 finetune，從而使得 task_head1 和 task_head2 去適應 backbone，直到浮點(diǎn)精度符合預期；

固定 backbone，對 task_head1 做 calib 和 QAT（backbone 的 weight 和 scale 不更新）

固定 backbone，對 task_hea2 做 calib 和 QAT（backbone 的 weight 和 scale 不更新）

固定 backbone 的 weight 和 scale 的方式見(jiàn)下文。

step4:

若 step2 驗證出的 head 精度符合預期，則使用以下方案：

固定 backbone 的 weight 和 scale，然后分別對 task_head1 和 task_head2 做 calib/qat；

2.2 固定 weight 的方式

固定 weight 采用 pytorch 的方法，包括固定 bn 和 stop 梯度更新這兩個(gè)操作，如下所示：

#固定bn` `model.eval()` `disable grad` `for param in model.parameters():` `    param.requires_grad = False

2.3 Fix weight 和 activation scale 的方式

征程 6 工具鏈中具有多種 Fix scale 的方式，本文將介紹其中的一種。自定義固定weight和activation的激活 scale 的 qconfig，即配置"averaging_constant": 0，如下為自定義的int8 weight和int8/int16 activation固定 scale 的方式：

from horizon_plugin_pytorch.quantization.qconfig import get_default_qconfig
qat_8bit_fixed_weight_16bit_fixed_act_fake_quant_qconfig = (
    get_default_qconfig(
        weight_qkwargs={
            "dtype": qint8,#weight采用int8量化
            "averaging_constant": 0,#averaging_constant 置為 0 以固定 scale
        },
        activation_qkwargs={
            "dtype": qint16,#采activation用int16量化
            "averaging_constant": 0,#averaging_constant 置為 0 以固定 scale
        },
    )
)
qat_8bit_fixed_weight_8bit_fixed_act_fake_quant_qconfig = (
    get_default_qconfig(
        weight_qkwargs={
            "dtype": qint8,
            "averaging_constant": 0,
        },
        activation_qkwargs={
            "dtype": qint8,
            "averaging_constant": 0,
        },
    )
)

2.4 示意圖

本節將會(huì )針對上述步驟展開(kāi)詳盡且全面的圖文闡釋?zhuān)ㄟ^(guò)清晰直觀(guān)的圖片和詳細準確的文字說(shuō)明，為您逐步剖析每個(gè)步驟的關(guān)鍵要點(diǎn)和操作細節。

2.4.1 驗證 backbone 變化對 head 的影響

此步驟的驗證前提是 backbone 已經(jīng)完成了 calib/qat，并且偽量化精度已經(jīng)滿(mǎn)足預期，這里建議 backbone 的偽量化精度要達到浮點(diǎn)精度的 90% 以上。

模型改造：在 backbone 的 forward 代碼的輸入端插入 Quanstub，輸出端插入 Dequanstub；

加載權重：在 prepare 之前加載 task_head1 或者 task_head2 的浮點(diǎn)權重，在 prepare 之后加載 backbone 的 calib/qat 權重，這里要特別注意加載權重的順序；

calibration：配置模型狀態(tài)（如下圖），注意這里模型的狀態(tài)要配置為 VALIDATION，然后進(jìn)行偽量化的精度的驗證；

如果某個(gè) head 的精度較差，那么將固定 backbone 的權重，對此 head 的權重進(jìn)行微調。

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞：算法 自動(dòng)駕駛 算法工具鏈 地平線(xiàn) 征程5

相關(guān)推薦

地平線(xiàn)與博世深化合作，輔助駕駛產(chǎn)品獲多家車(chē)企項目定點(diǎn)

汽車(chē)電子博世地平線(xiàn) 輔助駕駛 | 2025-04-25

恩智浦發(fā)布第三代成像雷達處理器，可支持L2+至L4級自動(dòng)駕駛

汽車(chē)電子恩智浦雷達處理器自動(dòng)駕駛 | 2025-05-09

無(wú)線(xiàn)傳感器網(wǎng)絡(luò )低功耗分簇路由算法設計

設計方案無(wú)線(xiàn) 傳感器網(wǎng)絡(luò ) 功耗路由算法設計 | 2012-09-07

PID算法

資源下載 PID 算法誤差 | 2007-02-16

ADI：傳感技術(shù)助力未來(lái)自動(dòng)駕駛的發(fā)展

視頻 ADI 自動(dòng)駕駛 | 2020-03-16

自動(dòng)駕駛的現狀與未來(lái)（節選）

視頻 ADI 自動(dòng)駕駛 | 2020-03-16

恩智浦推出用于L2+至L4自動(dòng)駕駛的第三代成像雷達處理器

汽車(chē)電子恩智浦自動(dòng)駕駛成像雷達處理器 | 2025-05-08

加密算法之MD5算法

資源下載加密算法加密算法 MD5算法 | 2007-02-16

英偉達推動(dòng) Ada 和 SPARK 進(jìn)入無(wú)人駕駛汽車(chē)

汽車(chē)電子英偉達自動(dòng)駕駛 Ada | 2025-06-05

上海車(chē)展前瞻：自動(dòng)駕駛新規出臺后，國產(chǎn)車(chē)能否撼動(dòng)特斯拉？

電源與新能源上海車(chē)展自動(dòng)駕駛新規國產(chǎn)車(chē) 特斯拉小米SU7 | 2025-04-22

CRC算法原理及C語(yǔ)言實(shí)現

資源下載 CRC 算法 C語(yǔ)言 | 2007-02-16

激光雷達如何破解自動(dòng)駕駛“視覺(jué)困境”？

汽車(chē)電子激光雷達自動(dòng)駕駛 | 2025-05-14

基于LPC2138的血壓測量算法開(kāi)發(fā)平臺電路圖

設計方案基于 LPC2138 血壓測量算法開(kāi)發(fā)平臺電路圖 | 2010-01-20

特斯拉開(kāi)始面向員工測試自動(dòng)駕駛打車(chē)服務(wù)，計劃今夏推無(wú)人出租車(chē)

汽車(chē)電子特斯拉自動(dòng)駕駛無(wú)人出租車(chē) FSD | 2025-04-24

計算機科學(xué)與技術(shù)反思錄(2)

liujt_ic | 2003-06-06

目標跟蹤算法在紅外熱成像跟蹤技術(shù)上的應用

設計方案目標跟蹤算法紅外成像技術(shù)上應用 | 2009-09-03

日本電裝與Rohm建立電動(dòng)汽車(chē)和自動(dòng)駕駛芯片聯(lián)盟

汽車(chē)電子電裝 Rohm 電動(dòng)汽車(chē) 自動(dòng)駕駛芯片聯(lián)盟 | 2025-05-12

vxwokrs下靜態(tài)圖像壓縮算法（上）

C-- | 2004-07-26

攜手ADI贏(yíng)得未來(lái)

視頻 ADI 自動(dòng)駕駛醫療健康 | 2019-11-08

抖音背后的算法推薦邏輯

智能計算抖音算法機器學(xué)習神經(jīng)網(wǎng)絡(luò ) 標簽 | 2025-04-22

數字PID控制及其改進(jìn)算法的應用

設計方案數字控制及其改進(jìn) 算法應用 | 2011-05-11

求FSK信號的解調算法，主要是鐵路上的移頻信號!

dhlwq007 | 2004-08-04

[轉帖]us/os就緒表的維護算法分析

amine | 2002-05-17

開(kāi)發(fā)支持自動(dòng)駕駛的Power Architecture

汽車(chē)電子自動(dòng)駕駛 Power Architecture | 2025-04-18

有關(guān)指紋算法

wsf999 | 2004-08-06

采用Mean-Shift和Camshift算法相結合的火焰視頻圖像跟蹤設計

設計方案采用 Mean-Shift Camshift 算法相結合 | 2011-06-27

簡(jiǎn)單實(shí)用的單片機CRC 快速算法

資源下載 CRC 算法單片機 | 2007-02-16

數字PID控制算法之一

資源下載 PID PID控制算法 | 2007-12-28

76-81GHz自動(dòng)駕駛CMOS RADAR

視頻 ADI 自動(dòng)駕駛 CMOS RADAR | 2018-05-31

加快實(shí)現自動(dòng)駕駛（完整小組討論）

視頻 ADI 自動(dòng)駕駛 | 2020-06-12

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>