哥倫比亞大學(xué)「機械手」無(wú)需提前了解抓握物體,也能靈活適應形狀!
以下文章來(lái)源于機器人大講堂 ,作者Robospeak
人類(lèi)天生擁有先進(jìn)而靈活的手部操縱能力,能夠輕松完成日常很多動(dòng)作,例如移動(dòng)物體、開(kāi)門(mén)、打字、繪畫(huà)等。
但對機器人來(lái)說(shuō),要實(shí)現多任務(wù)操控,并根據不同物體適應最合適的抓握手勢,這可是件難事。
那該如何控制機械手實(shí)現日常操作呢?
很多靈活強大的機械手使用了無(wú)模型強化學(xué)習技術(shù)(RL)來(lái)進(jìn)行精確抓握,這種方法通用性很強,它無(wú)需過(guò)多假設,而且能自動(dòng)掌握很多技能。由于這種方法除了建立函數無(wú)需其他信息,所以很容易在改進(jìn)后的環(huán)境中重新學(xué)習技能,例如更換了目標物體或機械手。
但大部分情況下,這種策略需要外部傳感信息,例如,用多攝像頭系統來(lái)跟蹤手指或物體,然而這種系統很難部署在實(shí)驗室以外的環(huán)境。
為了解決該問(wèn)題,哥倫比亞大學(xué)機器人操作和移動(dòng)實(shí)驗室的研究人員首次將無(wú)模型強化學(xué)習技術(shù)(RL)與本體觸覺(jué)反饋相結合,在沒(méi)有任何外部信息、機械手也不知道物體形狀的情況下,僅利用“觸覺(jué)感知”就能靈活操縱物體。
無(wú)需提前了解抓握物體,也能靈活適應形狀
將觸覺(jué)反饋與強化學(xué)習集成在一起,本身就是一個(gè)挑戰。
觸覺(jué)反饋通常是高維的,這會(huì )極大地增加強化學(xué)習所需的訓練樣本數量。因此,大多數使用強化算法控制機械手的工作要么完全避免使用觸覺(jué)反饋,要么考慮需要較少訓練樣本的任務(wù)。
為了避免大量的訓練樣本,研究人員考慮僅使用內部感知,不關(guān)注被抓物體的形狀,而是專(zhuān)注于讓機械手學(xué)習手指手勢(包括手指替換和重新抓握的操作)和手指旋轉(涉及手指抓握中的物體的操作)技能,這些不受手的運動(dòng)學(xué)約束的限制,可以實(shí)現潛在的物體形狀重新定向。
這個(gè)機械手并不包含手掌,所以可將手指的手勢學(xué)習主要集中在主軸旋轉,然后為每個(gè)軸獲得的手指采集策略以適當的順序組合,以實(shí)現目標方向的期望變化。
穩定抓取采樣,減少隨機性
僅用內部感知學(xué)習手勢的方法有一定的缺點(diǎn):行動(dòng)隨機化。
隨機的探索動(dòng)作容易擾亂精確抓握的物體的穩定性,導致其掉落,因此需要對手指位置穩定抓取采樣(SGS),以訓練穩定的抓握軌跡。
為了對手部姿勢進(jìn)行采樣,研究人員首先對物體周?chē)沫h(huán)內指尖位置進(jìn)行采樣,該環(huán)以物體為中心并與其部分重疊,因此指尖接觸物體和保持自由的概率大致相同。通過(guò)這個(gè)過(guò)程,不僅可以找到與手指步態(tài)和手指旋轉相關(guān)的穩定抓握,還可以提高發(fā)現它們的可能性,從而最大限度地減少訓練時(shí)間。
第一個(gè)將內在觸感與強化學(xué)習結合的實(shí)例
這項研究的預印本發(fā)表在arXiv上,論文標題為《On the Feasibility of Learning Finger-gaiting In-hand Manipulation withIntrinsic Sensing》。
為了促進(jìn)未來(lái)在真實(shí)場(chǎng)景中的部署,限制外部視覺(jué)或跟蹤傳感器等信息是很有必要的。這項研究是第一個(gè)成功地使用僅內在傳感信息進(jìn)行訓練的機械手實(shí)例,論文的第一作者,Gagan Khandate認為:“這項工作是邁向未來(lái)機械手操縱方向的非常有用的一步,不僅如此,我們在不使用手掌或其他表面進(jìn)行被動(dòng)支持的情況下,也能實(shí)現機械手的穩定操作技能?!?/p>
論文鏈接:
https://arxiv.org/abs/2109.12720
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。