<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 面向AD/ADAS的SoC的AI性能優(yōu)化

面向AD/ADAS的SoC的AI性能優(yōu)化

發(fā)布人：12345zhi 時(shí)間：2023-08-25 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

摘要

本文介紹了瑞薩在早期設計階段針對自動(dòng)駕駛（AD）和高級駕駛輔助系統（ADAS）的SoC中用于A(yíng)I處理的深度神經(jīng)網(wǎng)絡(luò )（DNN）加速器的性能、電路尺寸和功耗的工作內容。

——Yuji Obayashi

Principal Software Engineer

背景

近年，隨著(zhù)深度學(xué)習（DeepLearning）人工智能（AI）技術(shù)的進(jìn)步，我們的生活中出現了許多直接有益的應用場(chǎng)景，例如自動(dòng)翻譯精度的提升和根據消費者喜好的個(gè)性化推薦。截至2023年，AI在某些領(lǐng)域已經(jīng)成為產(chǎn)品和服務(wù)中不可或缺的應用，其中之一就是自動(dòng)駕駛（AD）和先進(jìn)駕駛輔助系統（ADAS）。

以深度神經(jīng)網(wǎng)絡(luò )（DNN）為代表的最新人工智能模型的處理需要大規模的并行計算，因此在PC開(kāi)發(fā)中通常使用通用的GPU進(jìn)行并行計算。另一方面，用于A(yíng)D和ADAS的SoC多數搭載了專(zhuān)用電路（以下簡(jiǎn)稱(chēng)加速器），實(shí)現了低功耗和高性能的DNN處理。然而，在SoC開(kāi)發(fā)的早期階段，確認搭載的加速器能否在實(shí)際所需的DNN中提供足夠的性能通常并不容易。性能比較的指標常常使用加速器設計上的最大計算性能TOPS（Tera Operations Per Second）值，或者其與運行時(shí)消耗的功率相除得到的TOPS/W值。然而，由于加速器是針對特定處理的專(zhuān)用設計（*1），即使TOPS值足夠高，在實(shí)際所需的DNN中也可能由于存在無(wú)法高效處理的計算或數據傳輸帶寬不足等問(wèn)題而無(wú)法提供足夠的性能。此外，加速器的功率增加可能導致整個(gè)SoC的功耗超過(guò)可接受的范圍。

（*1）專(zhuān)用設計：雖然使用通用GPU作為加速器也是可能的，但處理特定任務(wù)的硬件，可以在較小的電路規模和功耗下獲得更高的處理性能。例如瑞薩的車(chē)載SoC R-Car V3H、R-Car V3M和R-Car V4H搭載的加速器具有專(zhuān)為處理DNN中使用卷積操作進(jìn)行特征提取的卷積神經(jīng)網(wǎng)絡(luò )（CNN）任務(wù)而設計的結構。

隨著(zhù)SoC開(kāi)發(fā)的深入，由于性能不足或功耗過(guò)大等原因而進(jìn)行設計變更的難度普遍增加，對SoC開(kāi)發(fā)進(jìn)度和開(kāi)發(fā)成本的影響也隨之增加。因此，在開(kāi)發(fā)面向車(chē)載AI設備的SoC時(shí)，確認搭載的加速器能否在實(shí)際顧客產(chǎn)品中所需的DNN中提供足夠的性能，并且功耗是否在可接受范圍內，已成為迫切的問(wèn)題。

面向AD/ADAS的一般AI開(kāi)發(fā)流程

在解釋如何解決上述問(wèn)題之前，先簡(jiǎn)單介紹一下AD/ADAS的AI開(kāi)發(fā)流程。下面的圖1展示了在A(yíng)D/ADAS中以軟件為核心，并包括部分SoC開(kāi)發(fā)的AI開(kāi)發(fā)流程的示例。

圖1：AD/ADAS中AI開(kāi)發(fā)流程的例子

圖1將整個(gè)開(kāi)發(fā)工作分為六個(gè)階段，其中第2和第3階段為SoC電路設計，其他第1和第4-6階段為軟件開(kāi)發(fā)。下面給出了每個(gè)階段的工作概述。

第一階段 AI Application/Service Common Development

利用PC和云環(huán)境，以應對市場(chǎng)需求和技術(shù)趨勢，開(kāi)發(fā)面向AD/ADAS的AI應用程序和服務(wù)。

第二階段 AI Accelerator Detail Design

涵蓋了構成加速器硬件的部件設計，如計算單元、內部存儲器和數據傳輸單元。

第三階段 AI Accelerator Configuration

在第三階段中，第二階段中設計的組件被組合起來(lái)，以?xún)?yōu)化面積、功率和性能之間的權衡，同時(shí)確定加速器在SoC中的配置以實(shí)現各自的設計目標。

第四階段 DNN Model Architecture Design

在第三階段中確定的加速器配置被用來(lái)優(yōu)化每個(gè)用于客戶(hù)產(chǎn)品的DNN網(wǎng)絡(luò )的結構。

第五階段 DNN Inference Optimization

將針對經(jīng)過(guò)第四階段結構優(yōu)化的每個(gè)網(wǎng)絡(luò )進(jìn)行適用于加速器的代碼生成，并進(jìn)行精度和處理時(shí)間的詳細評估。同時(shí)，將對代碼和模型數據進(jìn)行優(yōu)化，以提高性能。

第六階段 Application Development

將使用第五階段中優(yōu)化的代碼和模型數據，將AI處理部分嵌入到實(shí)際的自動(dòng)駕駛等處理中，并進(jìn)行應用的實(shí)現和評估。

瑞薩的工作

在上一節所示的AD/ADAS中的AI開(kāi)發(fā)流程中，判斷實(shí)際使用的DNN是否能夠在所配備的加速器上提供足夠的性能，通常需要在決定加速器配置的第三階段AI Accelerator Configuration中進(jìn)行決策。

傳統上，在這一階段的決策是通過(guò)使用類(lèi)似加速器的現有SoC進(jìn)行的基準測試結果來(lái)估計的，但對于因增加或改變功能而與現有SoC規格不同的部分，無(wú)法獲得基準測試結果，因此無(wú)法通過(guò)高度精確的估計來(lái)確定是否能達到設計目標。

瑞薩通過(guò)使用PPA Estimator（PPA：Performance，Power，Area）而不是現有的SoC基準測試來(lái)解決這個(gè)課題。PPA Estimator通過(guò)使用反映加速器每個(gè)組件設計的性能和功率計算模型，使性能和功耗在加速器配置最終確定之前得到估算。具體來(lái)說(shuō)，列出可能的加速器配置（可改變的加速器參數的組合，如處理單元的數量和內部存儲器的容量）進(jìn)行評估，選擇其中一個(gè)配置并與要評估的一個(gè)DNN一起輸入PPA Estimator中，以獲得所需的執行時(shí)間和功耗。然后，可以針對所需評估的加速器配置和DNN的數量進(jìn)行重復操作，收集數據，并找到最佳的加速器配置。如此，不僅可以確定一個(gè)特定的加速器配置和DNN組合是否有足夠的性能，而且還可以收集廣泛的數據并從中選擇最佳加速器配置。

此外，為了使第三階段AI Accelerator Configuration更加有效，瑞薩還通過(guò)將從PPA Estimator執行結果中獲得的信息反饋給目標DNN的網(wǎng)絡(luò )模型，并行改進(jìn)軟件方面的工作，也就是進(jìn)行硬件-軟件聯(lián)合設計（co-design）。AI Accelerator Configuration階段的工作流程如下圖2所示。

圖2：AI Accelerator Configuration工作流程

瑞薩已開(kāi)始將PPA Estimator應用于從2023年開(kāi)始的一些帶有AI處理加速器的AD/ADAS的SoC的開(kāi)發(fā)中，并計劃逐步擴大應用范圍。瑞薩將利用PPA Estimator的高度精確性能尋找最佳配置以開(kāi)發(fā)高性能、低功耗的車(chē)載AI加速器。

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： ADAS 性能優(yōu)化

相關(guān)推薦

用ARM RealView調試TCPIP協(xié)議棧和網(wǎng)絡(luò )應用

資源下載 ARM RealView TCP/IP協(xié)議棧網(wǎng)絡(luò )應用 OS Awareness 單步調試性能優(yōu)化 | 2009-04-10

龍芯產(chǎn)品技術(shù)資料UserGuide中文版

資源下載龍芯 2F處理器微體系結構內存管理 Cache CP0控制寄存器處理器例外浮點(diǎn)部件特權指令 DDR2 SDRAM 集成IO控制器性能優(yōu)化 | 2008-10-04

ADI 視覺(jué)ADAS解決方案

資源下載 ADI ADAS | 2012-12-12

更智能、更高效，德州儀器助力 Nullmax 智能駕駛產(chǎn)品亮相北京車(chē)展

汽車(chē)電子智能駕駛 ADAS Nullmax | 2024-05-17

ADI 視覺(jué)ADAS解決方案.pdf

資源下載 ADI ADAS 解決方案 | 2012-07-10

Microchip收購ADAS和數字駕駛艙連接先驅VSI Co. Ltd.擴大車(chē)聯(lián)網(wǎng)市場(chǎng)領(lǐng)先地位

汽車(chē)電子 Microchip ADAS 數字駕駛艙 VSI 車(chē)聯(lián)網(wǎng) | 2024-04-22

2027年全球車(chē)用半導體市場(chǎng)營(yíng)收將突破85億美元

汽車(chē)電子 ADAS 自動(dòng)駕駛 IDC | 2024-06-03

使用虛擬原型評估基于MOST的先進(jìn)駕駛輔助系統

設計方案 MOST 虛擬原型 ADAS | 2015-06-26

利用堆疊同步降壓轉換器支持大電流的ADAS處理器

電源與新能源 TI 降壓轉換器 ADAS | 2024-05-07

吉利汽車(chē)與ST簽署SiC長(cháng)期供應協(xié)議，深化新能源汽車(chē)轉型；成立創(chuàng )新聯(lián)合實(shí)驗室，推動(dòng)雙方創(chuàng )新合作

汽車(chē)電子 SiC ADAS 新能源汽車(chē) | 2024-06-04

汽車(chē)ADC如何幫助設計人員在A(yíng)DAS中實(shí)現功能安全

TI宣傳員 | 2022-01-26

牛掰的無(wú)人駕駛汽車(chē)，一起來(lái)討論下背后的ADAS技術(shù)

maxvvvv | 2013-09-27

Neardi推出5路AHD高清視覺(jué)主機LPA3399Pro

neardi | 2020-10-21

使用TI的Vision AccelerationPac，實(shí)現汽車(chē)可視探測

設計方案 ADAS 汽車(chē)可視探測 TI TDA2x | 2015-06-27

基于視覺(jué)的駕駛員輔助嵌入式系統(下)

資源下載 ADAS 嵌入式 GPU | 2014-03-28

TI先進(jìn)駕駛員輔助系統(ADAS)解決方案介紹

設計方案 ADAS 處理器 ARM 駕駛員輔助系統 | 2015-06-25

羅德與施瓦茨和杜爾合作開(kāi)發(fā)ADAS/AD功能測試，用于下線(xiàn)測試（EOL）和定期檢查（PTI）

測試測量羅德與施瓦茨杜爾 ADAS 下線(xiàn)測試 EOL 定期檢查 PTI | 2024-05-21

瑞薩推出最新RoX開(kāi)發(fā)平臺，將極大提升軟件定義汽車(chē)的演進(jìn)速度

汽車(chē)電子 SDV RoX ADAS | 2024-06-21

ADAS HiL測試系統覆蓋信號級、系統級和整車(chē)級測試

eontronix | 2019-08-28

【轉】男子駕哈弗H9高速開(kāi)輔助自動(dòng)駕駛結果慘烈追尾變道大貨車(chē)

浮沉1988 | 2021-08-09

了解 ADAS 和車(chē)艙監控系統對網(wǎng)絡(luò )安全圖像傳感器的需求

物聯(lián)網(wǎng)與傳感器安森美 ADAS 車(chē)艙監控系統傳感器 | 2024-05-17

像蝙蝠一樣飛，世強24GHz單芯片雷達方案輕松實(shí)現精準定位

設計方案 24G雷達微波板材 RO4000 ADAS | 2015-08-09

車(chē)載雷達的未來(lái)之路

設計方案車(chē)載雷達 ADAS 多傳感器系統 FMCW | 2015-07-18

Microchip收購ADAS和數字駕駛艙連接先驅VSI Co. Ltd. 擴大車(chē)聯(lián)網(wǎng)市場(chǎng)領(lǐng)先地位

汽車(chē)電子 Microchip 收購 ADAS 數字駕駛艙連接 VSI Co. Ltd. 車(chē)聯(lián)網(wǎng) | 2024-05-13

汽車(chē)ADAS（先進(jìn)駕駛員輔助系統）動(dòng)向

視頻 ADAS Gartner Altera Broadcom Cadence | 2012-05-28

特斯拉FSD能否打破自動(dòng)駕駛的默認偏見(jiàn)？

汽車(chē)電子 202406 特斯拉 FSD 自動(dòng)駕駛 ADAS 神經(jīng)網(wǎng)絡(luò ) | 2024-05-23

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>