目標檢測也就是這么簡(jiǎn)單
1 背景
最近一直在看目標檢測類(lèi)干貨,慢慢在積累,今天就給大家帶來(lái)一個(gè)老早之前的小干貨!希望在閱讀的您可以喜歡這個(gè)主題和內容,謝謝大家的支持。
看到這些圖片大家應該都很熟悉,今天首要的主角就是他們,現在人機對戰已經(jīng)火熱進(jìn)行中,前不久美國的一場(chǎng)DOTA人機大戰拉開(kāi)了序幕,人工智能再次向人們證明了機器在某些領(lǐng)域強大的能力。
2 分析
在游戲中,如果想很好的了解對方“英雄”,首先必須得知道他(她)是哪位?所以,目標檢測是不是無(wú)處不在了?機器就是通過(guò)視覺(jué)得到對手是誰(shuí),然后進(jìn)行分析對手的所有屬性,最后通過(guò)不同時(shí)間幀前后的關(guān)系來(lái)預測接下來(lái)幾秒或寫(xiě)一秒的行為,通過(guò)不同的預測來(lái)得到最優(yōu)解,完美破解對手的一些行動(dòng),以最大的勝率來(lái)?yè)魯κ?。但是,今天我們只?lái)說(shuō)說(shuō)目標檢測這一模塊,因為這是前提條件!如果對人工智能游戲感興趣,可以閱讀:
基于心理學(xué)和數據驅動(dòng)的方法進(jìn)行游戲《LOL&王者榮耀》事件檢測與亮點(diǎn)事件預。
現在需要針對目標檢測的困難有目標大小變化多端、目標遮擋、光照、檢測速度,檢測精度等,今天帶領(lǐng)大家在這些領(lǐng)域去深入認識,針對性的去解決問(wèn)題。
RNN—>SSP—>Fast RCNN—>Faster RCNN—>YOLO—>SSD——>......
目標檢測的技術(shù)和知識在近三年得到了爆炸性的發(fā)展,應該說(shuō)現在的技術(shù)完全可以基本實(shí)現很多實(shí)際情況的問(wèn)題,但是依然沒(méi)有大力去發(fā)展去實(shí)施,最大的問(wèn)題就是不確定性。這一套技術(shù)其實(shí)現在還是不夠穩定不夠自適應。
一般常見(jiàn)的網(wǎng)絡(luò )訓練后,進(jìn)行測試一般都可以進(jìn)行簡(jiǎn)單的檢測,比如:
想必這種簡(jiǎn)單粗暴的方法大家都會(huì )去做,而且效果會(huì )比我的更好,但是如果是現實(shí)中的一些案例呢???譬如:
但是很多朋友出來(lái)的結果都是如下:
這種是不是就要比單一目標和較大較清晰的目標負責很多,也許也有很多朋友去說(shuō),這不是有很多優(yōu)秀的網(wǎng)絡(luò )(比如:Tiny-Net,T-CNN,SeetaFace等),但是每個(gè)網(wǎng)絡(luò )都有自己的優(yōu)勢所在,今天就來(lái)說(shuō)說(shuō)多目標且是小目標的檢測技術(shù),希望有興趣的您繼續看下去,謝謝!
為什么目標變小了的時(shí)候就會(huì )出現很多問(wèn)題,主要問(wèn)題就是特征表達性和判別性不足?所以針對表達性和判別性進(jìn)行深入研究,去就解決或緩解其帶來(lái)的檢測難題。
就好比上面的圖,如果再模糊一些再放小一些,你覺(jué)得你們認識嗎?所以通過(guò)這個(gè)到底,很簡(jiǎn)單就能理解特征表達的重要性,那怎么去解決呢?
現在可以通過(guò)這個(gè)圖很清楚的知道只要思想,就是利用目標的局部特征、全局特征和一些常見(jiàn)的融合特征,并進(jìn)行有規律的融合,既可以得到魯棒的特征表達,如下圖:
通過(guò)人臉目標的不同特征進(jìn)行詳細學(xué)習訓練特征表示。
想必上面幾幅圖大家都知道其出處,這種思想很好的利用了目標局部和全局特征,外加豐富的環(huán)境特征,從而很容易的就能把目標檢測出來(lái)。
最終的結果與下圖想必,也有很好的提升,而且在網(wǎng)絡(luò )過(guò)程中還加入了一些巧妙的改進(jìn),使其目標檢測更加精確。
以下模糊的展示我的簡(jiǎn)單網(wǎng)絡(luò )雛形之一,并且得到了非常好的結果。
今天的知識點(diǎn)就點(diǎn)到為止,但是我們平臺會(huì )時(shí)不時(shí)給大家講一些小小的思路,讓腦洞大開(kāi)的你有更好的創(chuàng )新,所以請有興趣的朋友繼續關(guān)注我們平臺的貢獻,謝謝支持!
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。