谷歌AI研究員利用YouTube“假人挑戰”改善深度預測
據外媒報道,谷歌AI研究員近日表示,他們使用2000個(gè)YouTube視頻網(wǎng)站上的“人體模型挑戰(mannequin challenge)”作為訓練數據集,以此來(lái)創(chuàng )建了一個(gè)能從運動(dòng)視頻中深度預測的AI模型。這種將有助于開(kāi)發(fā)人員在手持攝像機和3D視頻拍攝的場(chǎng)景中打造AR體驗。
本文引用地址:http://dyxdggzs.com/article/201905/400876.htm人體模型挑戰要求一群人基本上表現得像一個(gè)假人一樣保持靜止不動(dòng)。在一篇名為“通過(guò)觀(guān)察被定住的人來(lái)了解移動(dòng)的人的深度(Learning the Depths of Moving People by Watching Frozen People)”的論文中,研究人員表示,這一挑戰為他們提供了一個(gè)可以幫助檢測攝像頭和視頻中移動(dòng)的人的景深的數據集。
研究科學(xué)家Tali Dekel和工程師Forrester Cole在今天的一篇博客文章中寫(xiě)道:“雖然最近使用機器學(xué)習進(jìn)行深度預測的數量在激增,但現在這項工作則是首次針對攝像頭和人體運動(dòng)同時(shí)進(jìn)行的情況而量身定制的一種基于學(xué)習的方法?!?/p>
谷歌研究人員表示,這種方法在繪制深度地圖方面的表現優(yōu)于目前最先進(jìn)的工具。
為了制作這個(gè)模型,研究人員訓練了一個(gè)神經(jīng)網(wǎng)絡(luò ),該網(wǎng)絡(luò )能夠從RGB圖像、人類(lèi)區域的遮罩和視頻中非人類(lèi)環(huán)境的初始深度輸入,然后生成深度地圖進(jìn)而做出人類(lèi)的形狀和姿態(tài)預測。
評論