谷歌:未來(lái)機器人可以邊玩邊學(xué)
據外媒報道,近日,谷歌大腦展示了如何讓機器人沒(méi)有目標地“玩”也可以變得更聰明。谷歌通過(guò)模擬遠程操縱機器人獲得了一個(gè)數據集“Learning from Play data(LfP)”。在遠程操作中,研究人員讓機器人用機械手和機械臂與現實(shí)世界交互,但是沒(méi)有具體的目標。
本文引用地址:http://dyxdggzs.com/article/201903/398592.htm谷歌將這個(gè)數據集用于系統內,該系統試圖對這些有趣的動(dòng)作序列進(jìn)行分類(lèi),并將它們映射到一個(gè)潛在的空間。同時(shí),系統中的另一個(gè)模塊試圖查看潛在空間并提出可以將機器人從其當前狀態(tài)轉換到其目標狀態(tài)的動(dòng)作序列。
谷歌將使用這個(gè)數據集的方法與使用行為克隆技術(shù)等方法做比較,結果發(fā)現使用LfP數據集的機器人表現更穩定,且在大部分任務(wù)中成功率都較高。有趣的是,研究人員還發(fā)現,使用LfP數據集訓練的機器人在首次失敗后會(huì )多次重新嘗試完成任務(wù),且在從未接受過(guò)任務(wù)標簽訓練的情況下,機器人的潛在規劃空間會(huì )學(xué)會(huì )嵌入任務(wù)語(yǔ)義。
評論