智能圖像處理 讓機器視覺(jué)及其應用更智能高效
機器視覺(jué)(Machine Vision)是人工智能領(lǐng)域中發(fā)展迅速的一個(gè)重要分支,目前正處于不斷突破、走向成熟的階段。一般認為機器視覺(jué)“是通過(guò)光學(xué)裝置和非接觸傳感器自動(dòng)地接受和處理一個(gè)真實(shí)場(chǎng)景的圖像,通過(guò)分析圖像獲得所需信息或用于控制機器運動(dòng)的裝置”,可以看出智能圖像處理技術(shù)在機器視覺(jué)中占有舉足輕重的位置。
本文引用地址:http://dyxdggzs.com/article/201806/381668.htm智能圖像處理是指一類(lèi)基于計算機的自適應于各種應用場(chǎng)合的圖像處理和分析技術(shù),本身是一個(gè)獨立的理論和技術(shù)領(lǐng)域,但同時(shí)又是機器視覺(jué)中的一項十分重要的技術(shù)支撐。
具有智能圖像處理功能的機器視覺(jué),相當于人們在賦予機器智能的同時(shí)為機器按上了眼睛,使機器能夠“看得見(jiàn)”、“看得準”,可替代甚至勝過(guò)人眼做測量和判斷,使得機器視覺(jué)系統可以實(shí)現高分辨率和高速度的控制。而且,機器視覺(jué)系統與被檢測對象無(wú)接觸,安全可靠。
1.機器視覺(jué)技術(shù)
機器視覺(jué)的起源可追溯到20世紀60年代美國學(xué)者L.R.羅伯茲對多面體積木世界的圖像處理研究,70年代麻省理工學(xué)院(MIT)人工智能實(shí)驗室“機器視覺(jué)”課程的開(kāi)設。到80年代,全球性機器視覺(jué)研究熱潮開(kāi)始興起,出現了一些基于機器視覺(jué)的應用系統。90年代以后,隨著(zhù)計算機和半導體技術(shù)的飛速發(fā)展,機器視覺(jué)的理論和應用得到進(jìn)一步發(fā)展。
進(jìn)入21世紀后,機器視覺(jué)技術(shù)的發(fā)展速度更快,已經(jīng)大規模地應用于多個(gè)領(lǐng)域,如智能制造、智能交通、醫療衛生、安防監控等領(lǐng)域。目前,隨著(zhù)人工智能浪潮的興起,機器視覺(jué)技術(shù)正處于不斷突破、走向成熟的新階段。
在中國,機器視覺(jué)的研究和應用開(kāi)始于20世紀90年代。從跟蹤國外品牌產(chǎn)品起步,經(jīng)過(guò)二十多年的努力,國內的機器視覺(jué)從無(wú)到有,從弱到強,不僅理論研究進(jìn)展迅速,而且已經(jīng)出現一些頗具競爭力的公司和產(chǎn)品。估計隨著(zhù)國內對機器視覺(jué)研究、開(kāi)發(fā)和推廣的不斷深入,趕上和超越世界水平已不是遙不可及的事情了。
常見(jiàn)機器視覺(jué)系統主要可分為兩類(lèi),一類(lèi)是基于計算機的,如工控機或PC,另一類(lèi)是更加緊湊的嵌入式設備。典型的基于工控機的機器視覺(jué)系統主要包括:光學(xué)系統,攝像機和工控機(包含圖像采集、圖像處理和分析、控制/通信)等單元。機器視覺(jué)系統對核心的圖像處理要求算法準確、快捷和穩定,同時(shí)還要求系統的實(shí)現成本低,升級換代方便。
2.智能圖像處理技術(shù)
機器視覺(jué)的圖像處理系統對現場(chǎng)的數字圖像信號按照具體的應用要求進(jìn)行運算和分析,根據獲得的處理結果來(lái)控制現場(chǎng)設備的動(dòng)作,其常見(jiàn)功能如下:
(1)圖像采集
圖像采集就是從工作現場(chǎng)獲取場(chǎng)景圖像的過(guò)程,是機器視覺(jué)的第一步,采集工具大多為CCD或CMOS照相機或攝像機。照相機采集的是單幅的圖像,攝像機可以采集連續的現場(chǎng)圖像。就一幅圖像而言,它實(shí)際上是三維場(chǎng)景在二維圖像平面上的投影,圖像中某一點(diǎn)的彩色(亮度和色度)是場(chǎng)景中對應點(diǎn)彩色的反映。這就是我們可以用采集圖像來(lái)替代真實(shí)場(chǎng)景的根本依據所在。
如果相機是模擬信號輸出,需要將模擬圖像信號數字化后送給計算機(包括嵌入式系統)處理?,F在大部分相機都可直接輸出數字圖像信號,可以免除模數轉換這一步驟。不僅如此,現在相機的數字輸出接口也是標準化的,如USB、VGA、1394、HDMI、WiFi、Blue Tooth接口等,可以直接送入計算機進(jìn)行處理,以免除在圖像輸出和計算機之間加接一塊圖像采集卡的麻煩。后續的圖像處理工作往往是由計算機或嵌入式系統以軟件的方式進(jìn)行。
(2)圖像預處理
對于采集到的數字化的現場(chǎng)圖像,由于受到設備和環(huán)境因素的影響,往往會(huì )受到不同程度的干擾,如噪聲、幾何形變、彩色失調等,都會(huì )妨礙接下來(lái)的處理環(huán)節。為此,必須對采集圖像進(jìn)行預處理。常見(jiàn)的預處理包括噪聲消除、幾何校正、直方圖均衡等處理。
通常使用時(shí)域或頻域濾波的方法來(lái)去除圖像中的噪聲;采用幾何變換的辦法來(lái)校正圖像的幾何失真;采用直方圖均衡、同態(tài)濾波等方法來(lái)減輕圖像的彩色偏離??傊?,通過(guò)這一系列的圖像預處理技術(shù),對采集圖像進(jìn)行“加工”,為體機器視覺(jué)應用提供“更好”、“更有用”的圖像。
(3)圖像分割
圖像分割就是按照應用要求,把圖像分成各具特征的區域,從中提取出感興趣目標。在圖像中常見(jiàn)的特征有灰度、彩色、紋理、邊緣、角點(diǎn)等。例如,對汽車(chē)裝配流水線(xiàn)圖像進(jìn)行分割,分成背景區域和工件區域,提供給后續處理單元對工件安裝部分的處理。
圖像分割多年來(lái)一直是圖像處理中的難題,至今已有種類(lèi)繁多的分割算法,但是效果往往并不理想。近來(lái),人們利用基于神經(jīng)網(wǎng)絡(luò )的深度學(xué)習方法進(jìn)行圖像分割,其性能勝過(guò)傳統算法。
(4)目標識別和分類(lèi)
在制造或安防等行業(yè),機器視覺(jué)都離不開(kāi)對輸入圖像的目標進(jìn)行識別和分類(lèi)處理,以便在此基礎上完成后續的判斷和操作。識別和分類(lèi)技術(shù)有很多相同的地方,常常在目標識別完成后,目標的類(lèi)別也就明確了。近來(lái)的圖像識別技術(shù)正在跨越傳統方法,形成以神經(jīng)網(wǎng)絡(luò )為主流的智能化圖像識別方法,如卷積神經(jīng)網(wǎng)絡(luò )(CNN)、回歸神經(jīng)網(wǎng)絡(luò )(RNN)等一類(lèi)性能優(yōu)越的方法。
(5)目標定位和測量
在智能制造中,最常見(jiàn)的工作就是對目標工件進(jìn)行安裝,但是在安裝前往往需要先對目標進(jìn)行定位,安裝后還需對目標進(jìn)行測量。安裝和測量都需要保持較高的精度和速度,如毫米級精度(甚至更小),毫秒級速度。這種高精度、高速度的定位和測量,倚靠通常的機械或人工的方法是難以辦到的。在機器視覺(jué)中,采用圖像處理的辦法,對安裝現場(chǎng)圖像進(jìn)行處理,按照目標和圖像之間的復雜映射關(guān)系進(jìn)行處理,從而快速精準地完成定位和測量任務(wù)。
(6)目標檢測和跟蹤
圖像處理中的運動(dòng)目標檢測和跟蹤,就是實(shí)時(shí)檢測攝像機捕獲的場(chǎng)景圖像中是否有運動(dòng)目標,并預測它下一步的運動(dòng)方向和趨勢,即跟蹤。并及時(shí)將這些運動(dòng)數據提交給后續的分析和控制處理,形成相應的控制動(dòng)作。圖像采集一般使用單個(gè)攝像機,如果需要也可以使用兩個(gè)攝像機,模仿人的雙目視覺(jué)而獲得場(chǎng)景的立體信息,這樣更加有利于目標檢測和跟蹤處理。
評論