深度學(xué)習模型的云邊協(xié)同訓練和部署*
*基金項目:安徽省科技重大專(zhuān)項項目,基于5G通信的運化視覺(jué)檢測系統研發(fā)(202003a05020002)。
本文引用地址:http://dyxdggzs.com/article/202212/442005.htm0 引言
從“工業(yè)4.0”到“中國制造2025”,在國家大力提倡和發(fā)展工業(yè)生產(chǎn)智能制造的環(huán)境下,人工智能工業(yè)質(zhì)檢解決方案將全面賦能工業(yè)生產(chǎn)制造。目前視覺(jué)檢測系統憑借其獨特的優(yōu)勢逐漸替代人工檢測方式,廣泛應用于生產(chǎn)流水線(xiàn)中。與傳統方式相比,深度學(xué)習可以在訓練過(guò)程中自學(xué)習相關(guān)屬性,省去特征工程環(huán)節,識別精度更高、更加靈活。
深度學(xué)習模型的訓練往往要進(jìn)行大量數據的處理工作,對硬件的內存和計算能力要求較高,因此需要在資源充足的數據中心完成。在視覺(jué)檢測系統中,檢測器本身從硬件成本和檢測實(shí)時(shí)性考慮,都不適合充當數據中心。而在工廠(chǎng)內各車(chē)間、產(chǎn)線(xiàn)部署服務(wù)器單獨進(jìn)行模型訓練,既效率低,也無(wú)法實(shí)現模型的統一管理和部署。收集大量的樣本數據送往云端數據中心進(jìn)行模型訓練則存在兩個(gè)主要的弊端。一方面,將所有產(chǎn)線(xiàn)數據傳輸到云端會(huì )給核心網(wǎng)絡(luò )帶來(lái)沉重負擔,造成服務(wù)延時(shí)。另一方面,大量的原始數據通過(guò)廣域網(wǎng)傳輸容易泄露用戶(hù)數據隱私,違背用戶(hù)意愿。
隨著(zhù)工業(yè)互聯(lián)網(wǎng)和邊緣計算[2]的發(fā)展,將云邊協(xié)同[3]技術(shù)應用到深度學(xué)習模型的訓練和部署,可以解決目前工業(yè)質(zhì)檢領(lǐng)域深度學(xué)習模型訓練[4]和部署方法的不足,使模型的訓練和部署更加安全、高效、智能化、低成本。
1 系統架構組成
為了推動(dòng)工業(yè)質(zhì)檢領(lǐng)域深度學(xué)習技術(shù)的應用,本文提供了一種深度學(xué)習模型的云邊協(xié)同訓練和部署方法,為了實(shí)現上述目的采用如下技術(shù)方案,通過(guò)工業(yè)視覺(jué)檢測系統實(shí)現檢測模型的自動(dòng)化訓練和部署,具體系統架構組成如下。
1)如圖1 所示,工業(yè)視覺(jué)檢測系統包括檢測器、邊緣服務(wù)器、中心云服務(wù)器組成。
2)如圖2 所示,中心云服務(wù)器Web 應用執行分布式任務(wù)處理。在收到控制終端的控制命令后,發(fā)布異步任務(wù)(訓練或部署模型),發(fā)布定時(shí)任務(wù)更新任務(wù)執行進(jìn)度,任務(wù)信息立即放入消息隊列中,任務(wù)執行單元從消息隊列中依次取出任務(wù)執行,并存儲執行結果。
3)如圖3 所示,模型訓練任務(wù)流程。模型的訓練配置數據,包括訓練集、驗證集生成器配置、模型尺寸、迭代次數、分類(lèi)種類(lèi)配置,以及數據預處理、預訓練權重、回調函數、模型微調等項目配置,通過(guò)前端傳遞到中心云服務(wù)器后端,后端將任務(wù)消息放入Redis 隊列,任務(wù)執行單元從隊列取出并解析任務(wù)信息,向保持長(cháng)連接的邊緣服務(wù)器發(fā)送任務(wù),同時(shí)開(kāi)啟定時(shí)任務(wù),獲取任務(wù)執行進(jìn)度,如圖4 所示。邊緣服務(wù)器接收到任務(wù)之后,采集相應檢測器存儲的原始數據,采集完成后按照任務(wù)要求,開(kāi)展模型訓練,如圖5 所示。在回調函數中每次訓練Batch 開(kāi)始的時(shí)候記錄訓練進(jìn)度、模型精度和損失值,向中心云服務(wù)器定時(shí)返回模型訓練進(jìn)度和訓練效果。模型訓練完成,可自動(dòng)上傳至中心云服務(wù)器進(jìn)行進(jìn)一步的評估測試。
圖4 中心云服務(wù)器模型訓練配置界面
圖5 邊緣服務(wù)器模型訓練執行界面
4)如圖6 所示,模型部署任務(wù)流程。模型的部署配置數據,包括指定產(chǎn)線(xiàn)、指定檢測器、指定品牌模型等項目配置,通過(guò)前端傳遞到中心云服務(wù)器后端,后端將任務(wù)消息放入Redis 隊列,任務(wù)執行單元從隊列取出并解析任務(wù)信息,向保持長(cháng)連接的邊緣服務(wù)器發(fā)送任務(wù),同時(shí)開(kāi)啟定時(shí)任務(wù),獲取任務(wù)執行進(jìn)度。邊緣服務(wù)器接收到任務(wù)之后,向指定檢測器發(fā)送訓練好的模型文件。向中心云服務(wù)器定時(shí)返回模型下發(fā)進(jìn)度。檢測器接收完成模型文件,放入指定的品牌參數文件夾下,檢測器執行加載模型。邊緣服務(wù)器向中心云服務(wù)器返回模型部署成功消息。
通過(guò)上面具體實(shí)施方式,所述技術(shù)領(lǐng)域的技術(shù)人員可容易地實(shí)現本發(fā)明。但是應當理解,本發(fā)明并不限于上述的具體實(shí)施方式。在公開(kāi)的實(shí)施方式的基礎上,所述技術(shù)領(lǐng)域的技術(shù)人員可任意組合不同的技術(shù)特征,實(shí)現不同的技術(shù)方案。
2 部署方法
云邊協(xié)同的模型訓練和部署方法操作步驟如下:
1)檢測器由工控機、單片機、圖像采集通訊組件、光源控制電路、編碼器信號采集電路等部分組成,工廠(chǎng)內各產(chǎn)線(xiàn)檢測器調用深度學(xué)習模型對產(chǎn)品質(zhì)量進(jìn)行實(shí)時(shí)檢測,此外檢測器還負責將歷史數據傳送到該產(chǎn)線(xiàn)的邊緣服務(wù)器中。
2)邊緣服務(wù)器與中心云服務(wù)器保持長(cháng)連接,在收到中心云服務(wù)模型訓練命令后,解析命令,獲取任務(wù)參數信息,采集指定檢測器存儲數據,進(jìn)行模型訓練。同時(shí)定時(shí)更新訓練進(jìn)度、訓練精度、訓練損失值等過(guò)程信息給中心云服務(wù)器。
3)邊緣服務(wù)器與中心云服務(wù)器保持長(cháng)連接,在收到中心云服務(wù)模型部署命令后,解析命令,向檢測器下發(fā)訓練好的模型文件。同時(shí)定時(shí)更新模型下發(fā)進(jìn)度、檢測器加載模型進(jìn)度等過(guò)程信息給中心云服務(wù)器。
4)中心云服務(wù)器搭建Web 應用,接收用戶(hù)的遠程控制,向中心云服務(wù)器發(fā)送模型訓練和部署命令,以及接收中心云服務(wù)器返回信息,向用戶(hù)顯示任務(wù)執行情況。
3 結束語(yǔ)
通過(guò)云邊協(xié)同的方式訓練和部署深度學(xué)習模型,可以實(shí)現模型更加便捷地發(fā)布到檢測設備,確保生產(chǎn)車(chē)間數據不出廠(chǎng),降低了網(wǎng)絡(luò )負載和數據泄露風(fēng)險。同時(shí),充分利用邊緣服務(wù)器硬件資源,可視化和自動(dòng)化的深度學(xué)習模型訓練和部署,有利于推動(dòng)深度學(xué)習在智能制造、工業(yè)質(zhì)檢領(lǐng)域的商業(yè)化應用?;谶@種檢測方法可以開(kāi)發(fā)出應用于各種工業(yè)視覺(jué)檢測系統,具有廣泛的應用空間。
參考文獻:
[1] 曲春光.分布式深度學(xué)習訓練優(yōu)化設計與實(shí)現[D].重慶:西南大學(xué),2020:14-17.
[2] 劉建甌.基于邊緣計算的計算和網(wǎng)絡(luò )融合系統架構設計和實(shí)現[D].西安:西安電子科技大學(xué),2020:17-19.
[3] 崔羽飛,張云勇,張第,等.基于云邊協(xié)同的工業(yè)互聯(lián)網(wǎng)實(shí)踐[J].電信科學(xué).2020(2):110-115.
[4] 王海川.面向邊緣智能的模型訓練服務(wù)部署和任務(wù)卸載研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2020:16-33.
(本文來(lái)源于《電子產(chǎn)品世界》雜志2022年12月期)
評論