汽車(chē)中的AI:實(shí)用深度學(xué)習
未來(lái)某一天,整個(gè)社會(huì )可能會(huì )對人工智能以安全的方式駕駛車(chē)輛從一個(gè)地方到另一個(gè)地方感到相對舒適。至于這一轉折點(diǎn)何時(shí)到來(lái),我無(wú)法預知;然而,我認為到那時(shí),“智能”部分可能會(huì )比“人工”部分更接近“真實(shí)”。
本文引用地址:http://dyxdggzs.com/article/202503/468033.htm與此同時(shí),通過(guò)深度學(xué)習技術(shù)實(shí)現的人工智能的實(shí)際應用,可以在車(chē)輛安全系統的發(fā)展中發(fā)揮重要作用,而這些車(chē)輛的安全系統更容易被普通消費者掌握和使用。
深度學(xué)習是一個(gè)已有數十年歷史的概念,但由于特定的應用、技術(shù)(當然還有)通用計算平臺的性能,它現在變得更加相關(guān)。深度學(xué)習的“深度”來(lái)自于在輸入層和輸出層之間實(shí)現的隱藏層數量,這些隱藏層通過(guò)數學(xué)處理(過(guò)濾/卷積)每層之間的數據,以達到最終結果。在一個(gè)視覺(jué)系統中,與“寬”網(wǎng)絡(luò )相比,“深”網(wǎng)絡(luò )傾向于通過(guò)逐層識別特征,構建更通用的識別能力,從而實(shí)現最終的期望輸出。這些多層結構的優(yōu)勢在于它們能夠在不同層次的抽象中學(xué)習特征。
例如,如果你訓練一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò )(CNN)來(lái)對圖像進(jìn)行分類(lèi),第一層會(huì )學(xué)會(huì )識別非?;镜脑?,如邊緣。下一層學(xué)會(huì )識別邊緣的集合,這些集合形成形狀。再下一層學(xué)會(huì )識別形狀的集合,如眼睛或鼻子,而最后一層將學(xué)會(huì )更高層次的特征,如面部。多層結構之所以更擅長(cháng)泛化,是因為它們能夠學(xué)習從原始數據到高級分類(lèi)之間的所有中間特征。這種在多層中的泛化能力,如圖1所示,對于最終用途(例如分類(lèi)交通標志,或者識別戴墨鏡、帽子或其他遮擋物的特定面部)是非常有利的。
圖1 簡(jiǎn)化的交通標志示例
深度學(xué)習的“學(xué)習”特性來(lái)自于訓練過(guò)程中的迭代(反向傳播),通過(guò)這種方式,分層網(wǎng)絡(luò )能夠學(xué)會(huì )如何根據大量已知輸入及其期望輸出產(chǎn)生更準確的結果(見(jiàn)圖2)。這種學(xué)習過(guò)程通過(guò)迭代減少錯誤,并最終使分層函數的結果符合整個(gè)系統的要求,為目標應用提供非常強大的解決方案。這種類(lèi)型的學(xué)習、分層和互連類(lèi)似于生物神經(jīng)系統,因此支持了人工智能的概念。
圖2 簡(jiǎn)化的反向傳播示例
盡管深度學(xué)習的有效性似乎會(huì )長(cháng)期存在,但其實(shí)際應用仍面臨一些挑戰。如果應用是嵌入式的,并且對系統限制較為敏感(例如總體成本、功耗和有限的計算能力),那么支持深度學(xué)習的系統設計必須考慮這些限制。設計人員可以使用前端工具,如 Caffe(最初由加州大學(xué)伯克利分校開(kāi)發(fā)的深度學(xué)習框架)或 TensorFlow(谷歌的產(chǎn)物),來(lái)開(kāi)發(fā)整體網(wǎng)絡(luò )、層及其對應的函數,以及目標結果的訓練和驗證。一旦完成這些工作,針對嵌入式處理器的工具可以將前端工具的輸出轉換為可在該嵌入式設備上執行的軟件。德州儀器深度學(xué)習(TIDL)框架(見(jiàn)圖3)支持在德州儀器 TDAx 汽車(chē)處理器上運行基于深度學(xué)習/卷積神經(jīng)網(wǎng)絡(luò )(CNN)的應用程序,以在高效、嵌入式的平臺上提供極具吸引力的高級駕駛輔助系統(ADAS)功能。
圖3 TIDL框架(TI設備轉換器和深度學(xué)習庫)
TIDL框架為嵌入式開(kāi)發(fā)提供了快速的平臺抽象和軟件可擴展性,針對TI硬件實(shí)現了高度優(yōu)化的內核以加速CNNs,并提供了一個(gè)轉換器,能夠將來(lái)自開(kāi)放框架(如Caffe和TensorFlow)的網(wǎng)絡(luò )轉換為使用TIDL應用程序接口(APIs)的嵌入式框架。如需了解該解決方案的更多詳細信息,請閱讀白皮書(shū)《TIDL:嵌入式低功耗深度學(xué)習》,并查看附加資源中列出的視頻。
評論