<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 李飛飛「具身智能」新成果！機器人接入大模型直接聽(tīng)懂人話(huà)，0預訓練就能完成復雜指令（1）

李飛飛「具身智能」新成果！機器人接入大模型直接聽(tīng)懂人話(huà)，0預訓練就能完成復雜指令（1）

發(fā)布人：計算機視覺(jué)工坊時(shí)間：2023-07-11 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

李飛飛團隊具身智能最新成果來(lái)了：

大模型接入機器人，把復雜指令轉化成具體行動(dòng)規劃，無(wú)需額外數據和訓練。

從此，人類(lèi)可以很隨意地用自然語(yǔ)言給機器人下達指令，如：

打開(kāi)上面的抽屜，小心花瓶！

大語(yǔ)言模型+視覺(jué)語(yǔ)言模型就能從3D空間中分析出目標和需要繞過(guò)的障礙，幫助機器人做行動(dòng)規劃。

然后重點(diǎn)來(lái)了， 真實(shí)世界中的機器人在未經(jīng)“培訓”的情況下，就能直接執行這個(gè)任務(wù)。

新方法實(shí)現了零樣本的日常操作任務(wù)軌跡合成，也就是機器人從沒(méi)見(jiàn)過(guò)的任務(wù)也能一次執行，連給他做個(gè)示范都不需要。

可操作的物體也是開(kāi)放的，不用事先劃定范圍，開(kāi)瓶子、按開(kāi)關(guān)、拔充電線(xiàn)都能完成。

目前項目主頁(yè)和論文都已上線(xiàn)，代碼即將推出，并且已經(jīng)引起學(xué)術(shù)界廣泛興趣。

一位前微軟研究員評價(jià)到：這項研究走在了人工智能系統最重要和最復雜的前沿。

具體到機器人研究界也有同行表示：給運動(dòng)規劃領(lǐng)域開(kāi)辟了新世界。

還有本來(lái)沒(méi)看到AI危險性的人，因為這項AI結合機器人的研究而改變看法。

機器人如何直接聽(tīng)懂人話(huà)？

李飛飛團隊將該系統命名為VoxPoser，如下圖所示，它的原理非常簡(jiǎn)單。

首先，給定環(huán)境信息（用相機采集RGB-D圖像）和我們要執行的自然語(yǔ)言指令。

接著(zhù)，LLM（大語(yǔ)言模型）根據這些內容編寫(xiě)代碼，所生成代碼與VLM（視覺(jué)語(yǔ)言模型）進(jìn)行交互，指導系統生成相應的操作指示地圖，即3D Value Map。

所謂3D Value Map，它是Affordance Map和Constraint Map的總稱(chēng)，既標記了“在哪里行動(dòng)”，也標記了“如何行動(dòng)”。

如此一來(lái)，再搬出動(dòng)作規劃器，將生成的3D地圖作為其目標函數，便能夠合成最終要執行的操作軌跡了。

而從這個(gè)過(guò)程我們可以看到，相比傳統方法需要進(jìn)行額外的預訓練，這個(gè)方法用大模型指導機器人如何與環(huán)境進(jìn)行交互，所以直接解決了機器人訓練數據稀缺的問(wèn)題。

更進(jìn)一步，正是由于這個(gè)特點(diǎn)，它也實(shí)現了零樣本能力，只要掌握了以上基本流程，就能hold任何給定任務(wù)。

在具體實(shí)現中，作者將VoxPoser的思路轉化為一個(gè)優(yōu)化問(wèn)題，即下面這樣一個(gè)復雜的公式：

它考慮到了人類(lèi)下達的指令可能范圍很大，并且需要上下文理解，于是將指令拆解成很多子任務(wù)，比如開(kāi)頭第一個(gè)示例就由“抓住抽屜把手”和“拉開(kāi)抽屜”組成。

VoxPoser要實(shí)現的就是優(yōu)化每一個(gè)子任務(wù)，獲得一系列機器人軌跡，最終最小化總的工作量和工作時(shí)間。

而在用LLM和VLM將語(yǔ)言指令映射為3D地圖的過(guò)程中，系統考慮到語(yǔ)言可以傳達豐富的語(yǔ)義空間，便利用“感興趣的實(shí)體(entity of interest)”來(lái)引導機器人進(jìn)行操作，也就是通過(guò)3DValue Map中標記的值來(lái)反應哪個(gè)物體是對它具有“吸引力”的，那些物體是具有“排斥性”。

還是以開(kāi)頭的例子舉

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

AI+機器視覺(jué)成趨勢，圖文詳解N大應用場(chǎng)景

智能計算安森美 AI 機器視覺(jué) | 2024-07-31

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

iPhone 16將不會(huì )預裝AI功能？計劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠(chǎng)的生產(chǎn)力

winni945 | 2018-09-12

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

蘋(píng)果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

如何快速搭建手寫(xiě)體識別演示系統

視頻 digikey AI 手寫(xiě)體識別 | 2022-07-29

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

釋說(shuō)芯語(yǔ)16：硬科技：構建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺電腦... 一臺來(lái)創(chuàng )建AI... 一臺來(lái)模擬AI... 一臺來(lái)運行AI”

智能計算 AI | 2024-07-31

CSR8670CSR8675智能語(yǔ)音Alexa藍牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>