<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 編輯觀(guān)點(diǎn) > 人工智能開(kāi)啟視覺(jué)處理新篇章:如何更好的理解這個(gè)世界

人工智能開(kāi)啟視覺(jué)處理新篇章:如何更好的理解這個(gè)世界

作者:陳玲麗 時(shí)間:2020-07-20 來(lái)源:電子產(chǎn)品世界 收藏

的第三次浪潮正席卷全球,而在這次計算機視覺(jué)功不可沒(méi)。的終極目標在于使得計算機能像人一樣觀(guān)察感知世界,核心任務(wù)就是對圖像進(jìn)行理解,場(chǎng)景分類(lèi)、目標識別/圖像分類(lèi)、目標定位、目標檢測、語(yǔ)義分割、三維重建、目標跟蹤都是其研究?jì)热荨?/p>本文引用地址:http://dyxdggzs.com/article/202007/415836.htm

視覺(jué)與的融合

縱觀(guān)信息產(chǎn)業(yè)發(fā)展歷程,從個(gè)人電腦時(shí)代到移動(dòng)互聯(lián)網(wǎng)時(shí)代,承載高性能計算的芯片決定新型計算平臺的基礎架構和發(fā)展生態(tài),并掌握著(zhù)產(chǎn)業(yè)鏈最核心的話(huà)語(yǔ)權。傳統硬件架構難以滿(mǎn)足時(shí)代深度學(xué)習的要求,新的算法需要新的硬件來(lái)支撐。同時(shí),芯片的結構將越來(lái)越像“大腦”,類(lèi)腦芯片、智能芯片等將是人工智能的發(fā)展方向。

640.png

視覺(jué)芯片集成高速圖像傳感器和大規模并行圖像處理電路,能夠模仿人類(lèi)視覺(jué)系統視覺(jué)信息并行處理機制,解決現有視覺(jué)圖像系統中數據串行傳輸和串行處理的速度限制瓶頸問(wèn)題。人工智能(AI)視覺(jué)芯片與攝像頭的關(guān)系是:芯片做的是大腦,攝像頭做的是眼睛。

人眼的成像是非常聚焦的,只看到關(guān)注的東西。而當AI算法解決了“要看什么”的問(wèn)題后,前端成像就有了目標,可以把所有的資源都調配到關(guān)注的對象上,做到“指哪打哪”,也就是取出噪音的處理過(guò)程,可以更高效智能地處理視覺(jué)信息。這種根據AI的需求來(lái)成像,能解決很多以前解決不了的問(wèn)題。

現在,人工智能已從數據中心迅速發(fā)展到邊緣,最新的專(zhuān)用集成電路(ASIC)和片上系統(SoC)IP正在圍繞一個(gè)主題發(fā)展,即從視覺(jué)信息的預處理,到傳統的計算機視覺(jué)算法,然后再用神經(jīng)網(wǎng)絡(luò )進(jìn)行邊緣推理,產(chǎn)生對象檢測、識別以及適當的動(dòng)作,是包括計算機視覺(jué)深度學(xué)習在內的多種機器學(xué)習的總稱(chēng)。

這些網(wǎng)絡(luò )的設計旨在使用數字等效物和感知器來(lái)模擬人腦的神經(jīng)元和突觸,它們通常需要經(jīng)過(guò)訓練,才能識別視覺(jué)等數據中的模式,然后當遇到新的數據時(shí),就可以從中推斷出數據可能的含義。

在過(guò)去十年,由于可負擔計算能力的增加,以及卷積神經(jīng)網(wǎng)絡(luò )(CNN)及其所用傳感器的發(fā)展,一直在以指數級的速率進(jìn)步。具體而言,若能根據傳感器、數據集和SLAM(同時(shí)定位與映射)算法輸入去“了解”世界并對其“開(kāi)發(fā)出”表征模型,那么系統就可以開(kāi)始掌握周?chē)h(huán)境及其在空間中的位置,并做出預測和采取行動(dòng)。

在對人工智能而非提高像素的需求推動(dòng)下,特別是在由計算機視覺(jué)和數據驅動(dòng)的決策制定方面,GPU(圖形處理單元)領(lǐng)域已出現一場(chǎng)革命:神經(jīng)網(wǎng)絡(luò )的到來(lái)已使視覺(jué)處理成為現代世界的關(guān)鍵因素。因此,機器人處理操作、智能監控攝像頭以及汽車(chē)高級駕駛輔助系統(ADAS)等相關(guān)行業(yè)都發(fā)生了變化 —— 隨著(zhù)這類(lèi)技術(shù)的全面涌現,未來(lái)還將出現更多新的應用。

人工智能視覺(jué)處理都能做什么?

一片小小的人工智能視覺(jué)芯片能做什么?無(wú)人駕駛汽車(chē)主動(dòng)識別并避讓行人、攝像頭實(shí)時(shí)甄別在逃犯,這些影視作品中的情節,或許不久將可通過(guò)基于嵌入式人工智能視覺(jué)芯片的“解決方案”成為現實(shí)。人工智能芯片被視為未來(lái)人工智能時(shí)代的戰略制高點(diǎn)。在視覺(jué)感知領(lǐng)域,人工智能視覺(jué)芯片正逐步應用于智能手機、安防監控、自動(dòng)駕駛、醫療成像和智能制造等領(lǐng)域。

· 自動(dòng)駕駛:自動(dòng)駕駛汽車(chē)上裝有多個(gè)攝像頭,用來(lái)實(shí)現計算機視覺(jué)、對象識別、車(chē)道警告和駕駛員監控,以及其他傳感器(例如,熱成像、RADAR和LiDAR)而實(shí)現傳感器融合。人工智能和路徑規劃可以識別和預測是否有小孩會(huì )走到公路上,從而讓車(chē)輛預測和減速,以便采取規避行動(dòng)。在更簡(jiǎn)單的層面上,自動(dòng)代客泊車(chē)可以使駕駛員省去尋找停車(chē)位的負擔。

· 醫療成像:其中最突出的應用領(lǐng)域是醫療計算機視覺(jué)和醫學(xué)圖像處理,這個(gè)區域的特征的信息從圖像數據中提取用于使患者的醫療診斷的目的??梢詮膱D像數據中提取的一個(gè)例子是檢測的腫瘤,動(dòng)脈粥樣硬化或其他惡性變化,它也可以是器官的尺寸,血流量等。

· 智能制造:信息被提取為支撐的制造工序的目的,例如,質(zhì)量控制其中的信息或最終產(chǎn)品被以找到缺陷自動(dòng)檢測。同時(shí)也被大量用于農業(yè)的過(guò)程,從散裝材料,這個(gè)過(guò)程被稱(chēng)為去除不想要的東西,食物的光學(xué)分揀。

· 軍事應用:最明顯的例子是探測敵方士兵或車(chē)輛和導彈制導。更先進(jìn)的系統為導彈制導發(fā)送導彈的區域,而不是一個(gè)特定的目標,并且當導彈到達基于本地獲取的圖像數據的區域的目標做出選擇?,F代軍事概念,如“戰場(chǎng)感知”,意味著(zhù)各種傳感器,包括圖像傳感器,提供了豐富的有關(guān)作戰的場(chǎng)景,可用于支持戰略決策的信息。在這種情況下,數據的自動(dòng)處理,用于減少復雜性和融合來(lái)自多個(gè)傳感器的信息,以提高可靠性。

640.jpg

視覺(jué)處理行業(yè)的產(chǎn)業(yè)鏈是由上游基礎層、中游技術(shù)層以及下游應用層組成的。

· 上游基礎層基礎層:主要包括CPU、GPU等芯片硬件,深度神經(jīng)網(wǎng)絡(luò )、循環(huán)神經(jīng)網(wǎng)絡(luò )、卷積神經(jīng)網(wǎng)絡(luò )等算法,以及由真實(shí)數據和模擬數據共同構成的數據集。核心芯片被Intel、Nvidia等傳統芯片廠(chǎng)商把控,新型芯片廠(chǎng)商尚未崛起,規模應用有待時(shí)日;開(kāi)源平臺以谷歌的Tensorflow、Facebook的Caffe等為主,其它企業(yè)的深度學(xué)習框架多為二次開(kāi)發(fā)。

· 中游技術(shù)層:主要包括視頻識別、圖片識別、模式匹配等嵌入式視覺(jué)軟件,以及一站式解決方案。算法,初創(chuàng )企業(yè)占優(yōu);云計算,幾乎被AWS、Google Cloud、Azure、阿里云等壟斷。

· 下游應用層:為計算機視覺(jué)的落地場(chǎng)景,包括智慧安防、智慧金融、手機應用、無(wú)人駕駛等商業(yè)領(lǐng)域。垂直行業(yè)龍頭占據場(chǎng)景,技術(shù)層初創(chuàng )企業(yè)向上滲透。

由此,可以將國內計算機視覺(jué)的玩家分為三類(lèi):

1. ??低?、大華股份、宇視科技等安防廠(chǎng)商:安防影像分析的市場(chǎng)需求驅動(dòng)此類(lèi)企業(yè)的技術(shù)研發(fā),近年來(lái)安防行業(yè)頭部廠(chǎng)商紛紛推出自家智能化產(chǎn)品和解決方案。作為人工智能范疇中最關(guān)鍵的子領(lǐng)域之一(人類(lèi)從外界獲取的信息中有80%~85%是依靠視覺(jué)實(shí)現的),計算機視覺(jué)技術(shù)的愿景是利用攝像機等視覺(jué)傳感裝置來(lái)代替人眼對物體進(jìn)行識別、跟蹤和測量,再由計算機處理這些視覺(jué)信息,從而達到像人眼一樣對事物進(jìn)行感知和認知,直接對應安防監控系統“看得懂”的需求。

2. 互聯(lián)網(wǎng)巨頭公司:近年來(lái)基于深度學(xué)習的智能語(yǔ)音、計算機視覺(jué)、自然語(yǔ)言處理等技術(shù)開(kāi)始向各個(gè)應用領(lǐng)域滲透,全球人工智能產(chǎn)業(yè)規??焖僭鲩L(cháng)。為搶占人工智能高地,谷歌、微軟、阿里巴巴、百度、騰訊、IBM、Facebook 等國際知名企業(yè)均持續增加在人工智能領(lǐng)域的資本投入。美國、中國、英國、德國、日本等國家也分別出臺人工智能相關(guān)支持政策及國家戰略規劃,為整個(gè)產(chǎn)業(yè)的發(fā)展創(chuàng )造良好的政策環(huán)境。

3. 創(chuàng )業(yè)公司:包括商湯科技、依圖科技和曠視科技等企業(yè),普遍以細分領(lǐng)域為發(fā)力點(diǎn),布局思路各異。在商湯、曠視、依圖等頭部企業(yè)看,各家戰略思路差異明顯。商湯致力于構造平臺,專(zhuān)注底層基礎應用,力圖在完善平臺后于其他領(lǐng)域快速落地。曠視則在致力于在安防、金融、零售、汽車(chē)、教育等廣泛領(lǐng)域提供軟硬件一體化的解決方案。依圖則表現出對安防、醫療兩大領(lǐng)域的專(zhuān)注深耕,依托產(chǎn)品化、工程化能力深入落地。

AI視覺(jué)未來(lái)的發(fā)展

視覺(jué)人工智能行業(yè)的發(fā)展,離不開(kāi)技術(shù)的驅動(dòng):一方面諸如GPU、FPGA、ASIC等一系列AI芯片的出現極大提升了芯片計算能力,突破了傳統CPU的算力瓶頸;另一方面以深學(xué)習為代表的AI算法的崛起,使得AI視覺(jué)的識別能力有了很大的提高。硬件算力的提升以及軟件算法的進(jìn)步都對視覺(jué)人工智能的發(fā)展起到了重要的推動(dòng)作用。

AI視覺(jué)行業(yè)的快速發(fā)展一方面得益于現階段算力的大幅提升及算法的大幅改善(國內算法甚至已經(jīng)達到國際水平),另一方面則受益于下游應用市場(chǎng)的廣闊空間。機器學(xué)習、深度學(xué)習等算法能力的不斷增強促進(jìn)了視覺(jué)人工智能行業(yè)的高速發(fā)展。

640.jpg

視覺(jué)處理的工作流程包含四個(gè)模塊:檢測、分類(lèi)、跟蹤與語(yǔ)義分割。具體為成像設備首先捕獲圖像,然后對每個(gè)圖像進(jìn)行預處理,提取特征后輸入到分類(lèi)模型中。人工智能視覺(jué)是采用圖像處理、模式識別、人工智能技術(shù)相結合的手段,著(zhù)重于一幅或多幅圖像的計算機分析。

圖像可以由單個(gè)或者多個(gè)傳感器獲取,也可以是單個(gè)傳感器在不同時(shí)刻獲取的圖像序列。在消費級領(lǐng)域,隨著(zhù)數據量上漲、運算力提升和深度學(xué)習算法的發(fā)展,計算機視覺(jué)技術(shù)越來(lái)越多地被應用在各類(lèi)消費級應用場(chǎng)景中,典型的如人臉識別服務(wù),具體包括人臉檢測、人臉關(guān)鍵特征點(diǎn)、人臉對比、人臉搜索、人臉屬性、人臉聚類(lèi)、人力活體檢測等。

AI視覺(jué)處理就是用各種成像系統代替視覺(jué)器官作為輸入敏感手段,由計算機來(lái)代替大腦完成處理和解釋。這里要指出的一點(diǎn)是在計算機視覺(jué)系統中計算機起代替人腦的作用,但并不意味著(zhù)計算機必須按人類(lèi)視覺(jué)的方法完成視覺(jué)信息的處理,計算機視覺(jué)可以而且應該根據計算機系統的特點(diǎn)來(lái)進(jìn)行視覺(jué)信息的處理。但是,人類(lèi)視覺(jué)系統是迄今為止,人們所知道的功能最強大和完善的視覺(jué)系統。

當前人工智能理論和技術(shù)日益成熟,應用范圍不斷擴大,產(chǎn)業(yè)正在逐步形成、不斷豐富,相應的商業(yè)模式也在持續演進(jìn)和多元化。據IDC統計,2018年我國人工智能市場(chǎng)規模為161.9億元,預計到2022年市場(chǎng)規模將接近700億元,年復合增長(cháng)率超過(guò)50%。據中國人工智能學(xué)會(huì )和羅蘭貝格咨詢(xún)公司預測,2025年市場(chǎng)規模將達到3萬(wàn)億美元。

以深度學(xué)習為代表的人工智能算法的出現極大推動(dòng)了視覺(jué)人工智能行業(yè)的發(fā)展。計算機視覺(jué)是人工智能行業(yè)的最大組成部分,與其他細分的比較來(lái)看,計算機視覺(jué)技術(shù)應用的市場(chǎng)規模也遠遠大于其他細分。

那么,視覺(jué)系統芯片如果在未來(lái)實(shí)現產(chǎn)業(yè)化,其市場(chǎng)空間有多大?據推算,2018年,圖像傳感器的市場(chǎng)規模在150億美元左右,雖然其中120億美元發(fā)生在智能手機領(lǐng)域,但未來(lái)發(fā)展比較快的4個(gè)領(lǐng)域是安防、國防、汽車(chē)、醫療,到2021年將會(huì )迎來(lái)40億美元的市場(chǎng)空間,年增長(cháng)率約10%—20%。

視覺(jué)處理器的需求增長(cháng)會(huì )更快,目前該市場(chǎng)的整體規模(包括硬件、軟件、服務(wù))在170億美元至180億美元,單從硬件來(lái)看也占到約30億美元。如果視覺(jué)系統芯片可以覆蓋70億美元的市場(chǎng)規模,企業(yè)在這中間拿到1%的話(huà),其盈利空間就已經(jīng)很大了。

近年來(lái),國內外一批新型人工智能企業(yè),依托人工智能領(lǐng)域技術(shù)和算法優(yōu)勢向芯片行業(yè)滲透,加強人工智能芯片基礎層研發(fā)。從市場(chǎng)格局來(lái)看,已經(jīng)發(fā)展成為一個(gè)相對獨立又相互依存的產(chǎn)業(yè)生態(tài)。在前端,索尼是圖像傳感器市場(chǎng)、生產(chǎn)和技術(shù)的領(lǐng)導者,緊隨其后的三星和豪威科技也保持著(zhù)不錯的競爭力;在后端,Mobileye和英偉達(NVIDIA)是提供視覺(jué)處理芯片的主要廠(chǎng)商,在國內該領(lǐng)域的公司有地平線(xiàn)等。

然而,截至目前,尚未有企業(yè)實(shí)現“圖像傳感器+視覺(jué)處理器”集成式芯片的大規模量產(chǎn)。不管是現在的創(chuàng )業(yè)企業(yè),還是已經(jīng)在市場(chǎng)上占有一定份額的大企業(yè),不是做圖像傳感器,就是做后端的視覺(jué)處理器,這將給初創(chuàng )企業(yè)帶來(lái)機會(huì )。



關(guān)鍵詞: 人工智能 視覺(jué)處理

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>