<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > ONNX 淺析：如何加速深度學(xué)習算法工程化？

ONNX 淺析：如何加速深度學(xué)習算法工程化？

發(fā)布人：計算機視覺(jué)工坊時(shí)間：2021-12-15 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

以下文章來(lái)源于拍樂(lè )云Pano ，作者拍樂(lè )云視頻專(zhuān)家

AlphaGo擊敗圍棋世界冠軍李世石以來(lái)，關(guān)于人工智能和深度學(xué)習的研究呈現井噴之勢。

各種新的算法和網(wǎng)絡(luò )模型層出不窮，令人眼花繚亂。與之相隨的，深度學(xué)習的訓練和推理框架也在不斷的推陳出新，比較著(zhù)名的有：微軟的CNTK、Google的TensorFlow、Facebook的PyTorch、Apple的CoreML、Intel 的OpenVINO、英偉達的cuDNN和TensorRT、騰訊的TNN和NCNN、阿里的MNN等等。

這些框架都有相似之處，他們的輸入是一個(gè)或者一組多維數據，數據經(jīng)過(guò)多層運算單元之后輸出運算結果。訓練框架支持BackPropogation等訓練方法，可以自動(dòng)調整模型參數，用于算法設計。推理框架則是單純只能用于模型推理運算，不能調整模型本身，用于算法部署落地。

這些框架中，Google的TensorFlow的這個(gè)名字尤其具有美感。多維數據是為張量(Tensor)，數據在多層運算單元中的運算和傳遞是為流(FLow)，看到這個(gè)詞就仿佛看到了一個(gè)數據和運算的圖(Computation Graph)，真可謂妙手偶得之佳作。這些框架都需要構建算子，并且將這些算子按照一定的次序連接起來(lái)，可以稱(chēng)之為網(wǎng)絡(luò )模型。

01 Why ONNX？

每個(gè)深度學(xué)習框架都有自己獨有的格式來(lái)解釋和存儲網(wǎng)絡(luò )模型，并且這些框架的側重點(diǎn)不同，有些用于訓練學(xué)習，有些用于部署推理。在深度學(xué)習算法開(kāi)發(fā)中，在不同的階段會(huì )選擇不同的框架，所以模型描述格式的不同，在客觀(guān)上造成了深度學(xué)習算法開(kāi)發(fā)和落地的困難。

筆者之前曾開(kāi)發(fā)深度神經(jīng)網(wǎng)絡(luò )算法，當時(shí)選擇的訓練框架是Caffe，需要落地部署到Linux、iOS、Android等多個(gè)平臺。Linux選擇的是Nvidia的cuDNN；iOS選擇的是CoreML；Android選擇的是NNAPI，Caffe的模型描述格式是caffemodel。

它使用自定義的Protobuf (https://github.com/BVLC/caffe/tree/master/src/caffe/proto)，但是顯然，無(wú)論是cuDNN、CoreML、NNAPI都無(wú)法直接使用caffemodel，CoreML的模型描述使用另一種定義 (https://apple.github.io/coremltools/mlmodel/index.html)，cuDNN和NNAPI都是low-level的推理引擎，需要使用者將這個(gè)模型組裝起來(lái)。

對于CoreML來(lái)說(shuō)，我們需要把caffemodel轉為coremlmodel格式，對于 cuDNN和NNAPI，我們需要解析caffemodel，然后自己組裝出完整的網(wǎng)絡(luò )模型。這個(gè)過(guò)程繁瑣而且容易出錯，當時(shí)有強烈的沖動(dòng)，希望定義一個(gè)統一的模型描述格式，所有的訓練框架訓練所得的網(wǎng)絡(luò )模型，都是用這個(gè)格式來(lái)描述，在設備上部署推理時(shí)，相應的推理引擎支持解析這個(gè)統一的描述格式，直接完成部署落地，豈不美哉。

當然此事并不容易，要定義個(gè)統一的模型描述格式，不僅僅需要對機器學(xué)習技術(shù)有深入的理解，而且將之推廣成為事實(shí)上的行業(yè)標準，更需要有很大的行業(yè)影響力，并不是如筆者這樣的無(wú)名小卒可以為之。所幸已經(jīng)有社區在做這個(gè)事情了，這就是Open Neural Network Exchange(ONNX)。

用ONNX自己的話(huà)來(lái)說(shuō)，ONNX是一個(gè)對計算網(wǎng)絡(luò )(Computation Graph)的一個(gè)通用描述(Intermediate Representation)。它希望被設計成為開(kāi)放的網(wǎng)絡(luò )描述格式，減少開(kāi)發(fā)者在各個(gè)訓練和推理框架間切換的代價(jià)，可以讓開(kāi)發(fā)者專(zhuān)注于算法和優(yōu)化。雖然ONNX還處于比較早期的階段，不過(guò)已經(jīng)有約來(lái)越多的人開(kāi)始關(guān)注到它，未來(lái)會(huì )有機會(huì )得到更廣泛的應用。

02 計算模型描述

ONNX有兩個(gè)分類(lèi)：基礎的ONNX主要用于描述神經(jīng)網(wǎng)絡(luò )、ONNX-ML是對基礎ONNX的擴展，增加了神經(jīng)網(wǎng)絡(luò )之外的其他機器學(xué)習算法的支持。本文不會(huì )涉及ONNX-ML，接下來(lái)的文字以一個(gè)簡(jiǎn)單的ONNX模型為例，介紹一下 ONNX是如何來(lái)描述一個(gè)計算網(wǎng)絡(luò )的。該模型可以在ONNX的Github上下載(https://github.com/onnx/models/blob/master/vision/classification/mobilenet/model/mobilenetv2-7.onnx).

ONNX的模型描述采用了Google的Protocol Buffer語(yǔ)言。最外層的結構是ModelProto，它的定義如下：

message ModelProto {
  int64 ir_version = 1;
  repeated OperatorSetIdProto opset_import = 8;
  string producer_name = 2;
  string producer_version = 3;
  string domain = 4;
  int64 model_version = 5;
  string doc_string = 6;
  GraphProto graph = 7;
  repeated StringStringEntryProto metadata_props = 14;
  repeated TrainingInfoProto training_info = 20;
  repeated FunctionProto functions = 25;
}

比較重要的字段有:

lr_version : 當前的ONNX模型文件的版本，目前發(fā)布的最新版本為IR_VERSION_2019_3_18 = 6. 發(fā)布于2019年，版本7還在制定中。

opset_import: 當前的模型文件所依賴(lài)的算子domain和版本。

graph: 這個(gè)模型執行的運算圖，這個(gè)是最重要的字段。

GraphProto的定義如下：

message GraphProto {
  repeated NodeProto node = 1;
  string name = 2;   // namespace Graph
  repeated TensorProto initializer = 5;
  repeated SparseTensorProto sparse_initializer = 15;
  string doc_string = 10;
  repeated ValueInfoProto input = 11;
  repeated ValueInfoProto output = 12;
  repeated ValueInfoProto value_info = 13;
  repeated TensorAnnotation quantization_annotation = 14;
}

比較重要的字段有:

initializer : 模型的每一網(wǎng)絡(luò )層的參數, 模型訓練完成之后參數就被固定下來(lái)。

input : 模型的輸入格式。

output : 模型的輸出格式。

nodes : 定義了模型的所有運算模塊，依照推理的次序排布。

NodeProto的定義如下：

message NodeProto {
  repeated string input = 1;    // namespace Value
  repeated string output = 2;   // namespace Value
  string name = 3;     // namespace Node
  string op_type = 4;  // namespace Operator
  string domain = 7;   // namespace Domain
  repeated AttributeProto attribute = 5;
  string doc_string = 6;
}

比較重要的字段有:

input : 輸入參數的名字。

output : 輸出參數的名字，這里需要留意的是，每一個(gè)網(wǎng)絡(luò )層之間的連接使用輸入和輸出的名字來(lái)確立的。

op_type : 算子的類(lèi)型。

attributes : 算子的屬性，其解析取決于算子的類(lèi)型。

ONNX中最復雜的部分就是關(guān)于各種算子的描述，這也可以理解，構成神經(jīng)網(wǎng)絡(luò )的主體就是這些算子。attributes 就是算子的一組帶名字的屬性。

本文中，我們介紹一個(gè)在mobilenetv2-7.onnx使用最多的算子: conv。

卷積神經(jīng)網(wǎng)絡(luò )在語(yǔ)音，圖像，視頻等處理上獲得了巨大成功. ONNX關(guān)于卷積網(wǎng)絡(luò )層的屬性定義主要有:

dilations: 擴展卷積，默認為1，即普通卷積。其數學(xué)定義如下：

group: 分組卷積, 其定義見(jiàn)文獻14. 默認為1，即不分組。

kernel_shape: 定義了卷積核的大小。

pads: 定義了上下左右填充的像素數。

strides: 定義了卷積運算的步長(cháng)。

03 ONNX的支持情況

各家的訓練和推理框架還在繼續發(fā)展，ONNX想成為行業(yè)標準顯然還為時(shí)尚早，但是目前尚沒(méi)有看到其他更好的通用模型描述格式，我們簡(jiǎn)單歸納一下現在的ONNX的支持情況(不完整)：

參考文獻

[1] ONNX: https://github.com/onnx/onnx

[2] TENSORFLOW: https://www.tensorflow.org/

[3] CNTK: https://github.com/Microsoft/CNTK

[4] PYTORCH: https://pytorch.org/

[5] TNN: https://github.com/Tencent/TNN

[6] MNN: https://github.com/alibaba/MNN

[7] CUDNN: https://developer.nvidia.com/zh-cn/cudnn

[8] TENSORRT: https://developer.nvidia.com/zh-cn/tensorrt

[9] COREML: https://developer.apple.com/documentation/coreml

[10] NCNN: https://github.com/Tencent/ncnn

[11] NNAPI: https://developer.android.com/ndk/guides/neuralnetworks

[12] Protocol Buffers: https://developers.google.com/protocol-buffers

[13] Dilated Convolutions https://arxiv.org/abs/1511.07122

[14] Dynamic Group Convolutions https://arxiv.org/abs/2007.04242

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 深度學(xué)習

相關(guān)推薦

Deep Learning中文版

資源下載深度學(xué)習中文 | 2019-06-11

射頻系統的深度學(xué)習

資源下載 ADI RF DSP 深度學(xué)習 | 2020-04-20

基于圖結構的圖像注意力網(wǎng)絡(luò )

智能計算 202207 深度學(xué)習注意力機制圖像分類(lèi) 人臉識別 | 2022-07-26

視覺(jué)慣性導航融合算法研究進(jìn)展

物聯(lián)網(wǎng)與傳感器 202302 視覺(jué)慣性導航優(yōu)化耦合算法深度學(xué)習 | 2023-02-21

一種改進(jìn)的可遷移深度學(xué)習模型*

智能計算 202210 可遷移深度學(xué)習無(wú)標簽 | 2022-10-25

基于深度學(xué)習的智能電網(wǎng)短期日負荷曲線(xiàn)預測系統設計與實(shí)現

智能計算 202302 深度學(xué)習短期負荷預測卷積神經(jīng)網(wǎng)絡(luò ) 長(cháng)短期記憶網(wǎng)格 Flask | 2023-02-27

什么是人機交互技術(shù)？

龍騰AI技術(shù) | 2022-11-02

深度學(xué)習模型的云邊協(xié)同訓練和部署*

智能計算云邊協(xié)同深度學(xué)習服務(wù)器部署 202212 | 2022-12-22

AI深度學(xué)習

loof_lripa | 2024-04-20

深度學(xué)習（人工神經(jīng)網(wǎng)絡(luò )的研究的概念）

大綠葉 | 2020-07-28

直覺(jué)有害！Facbook最新研究：易于解釋的神經(jīng)元會(huì )誤導DNN的學(xué)習

智能計算 DNN 深度神經(jīng)網(wǎng)絡(luò ) 深度學(xué)習 | 2022-07-05

Firefly DL小巧輕便，嵌入式深度學(xué)習加速部署

智能計算 Firefly DL 深度學(xué)習人工智能 | 2023-12-22

基于深度學(xué)習的跌倒檢測技術(shù)對比與分析*

智能計算深度學(xué)習跌倒檢測卷積神經(jīng)網(wǎng)絡(luò ) 長(cháng)短期記憶網(wǎng)絡(luò ) 202212 | 2022-12-22

為什么深度學(xué)習如此容易被愚弄？AI研究員正努力修復神經(jīng)網(wǎng)絡(luò )缺陷

智能計算 DNN 深度神經(jīng)網(wǎng)絡(luò ) 深度學(xué)習 | 2022-07-05

深度學(xué)習（DeepLearning）

szhlss123 | 2022-08-17

TFLite模型的開(kāi)盲盒體驗

嵌入式系統 TFLite 模型推理庫深度學(xué)習 | 2024-05-10

深度強化學(xué)習核心技術(shù)開(kāi)發(fā)與應用

szhlss123 | 2022-08-10

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>