人形機器人,有什么值得期待?
在那個(gè)第一臺黑白電視機在美國初初面世、距離后世著(zhù)名的“圖靈測試”問(wèn)世仍有11年的年代,這樣酷炫的產(chǎn)品自然引起了世界范圍的關(guān)注。一時(shí)間,Elektro風(fēng)頭無(wú)兩,上電視、演電影、到各地巡回演出,甚至擁有了自己的機械狗Sparko。
以當下的技術(shù)眼光看,Elektro這些所謂的“技能”其實(shí)更多是噱頭——所謂的“走路”,依靠的是輪子和軌道;與操作員的“對話(huà)”,則是通過(guò)預先設計好的特殊音節代碼實(shí)現;而別具特色的“抽煙”,則是靠助手把煙塞進(jìn)它上嘴唇的洞中并點(diǎn)燃。
高調亮相的背后,卻是,普通的落地。
而這一幕與當下人形機器人們的處境也何其相似:本田的Asimo表演踢足球,波士頓動(dòng)力的Atlas能后空翻,小米的“鐵大”在發(fā)布會(huì )上給雷軍獻花后還學(xué)起了敲架子鼓。人們充滿(mǎn)驚奇地欣賞完舞臺秀之后,卻在商業(yè)應用方向感嘆:就這?
80年過(guò)去了,人們對機器人的想象早已不是這樣“形”上的模仿,而是期待一款真正能成為勞動(dòng)力替代的全能型產(chǎn)品,并且要經(jīng)濟實(shí)惠到足以從實(shí)驗室走進(jìn)生產(chǎn)線(xiàn),切實(shí)在某個(gè)應用場(chǎng)景中發(fā)揮效用。那在供需天平的另一端,制造機器人的企業(yè),圍繞"人形"做文章已久,又是否真正努力過(guò)實(shí)現機器代人?
據此,本文將回顧走在技術(shù)研發(fā)前線(xiàn)的兩款機器人,Asimo與Atlas的艱難產(chǎn)業(yè)化進(jìn)程,盤(pán)點(diǎn)當下最火“擎天柱”Optimus的技術(shù)亮點(diǎn),以此展望:人形機器人,商業(yè)化路在何方?
01還沒(méi)有一家人形機器人公司能實(shí)現商業(yè)化
人形機器人發(fā)展至今,已經(jīng)見(jiàn)得了總統,上得了春晚,當得了男團,功能酷炫上天,但在商業(yè)上還是難以落地。本田Asimo、軟銀Pepper均已經(jīng)停產(chǎn),波士頓動(dòng)力Atlas、特斯拉Optimus也還尚處于實(shí)驗室階段。為何產(chǎn)業(yè)化那么難?就拿人們最期待的本田Asimo和波士頓動(dòng)力Atlas來(lái)說(shuō)一說(shuō)。
“時(shí)代先驅”本田Asimo ,Born in 2000
從高達和新世界福音戰士等一系列日本動(dòng)漫可以看出,似乎日本對于人形機器人有一種與生俱來(lái)的執念,而濃厚的機器人產(chǎn)業(yè)底蘊以及良好的經(jīng)濟基礎,也給這個(gè)時(shí)期的日本研發(fā)人形機器人提供了良好的環(huán)境。
自 1967 年起,日本人就在仿人機器人領(lǐng)域孤獨地前行了半個(gè)世紀。而本田的ASIMO ,被認為是致敬著(zhù)名科幻作家阿西莫夫Asimov,它作為全球最早實(shí)現雙足行走能力的機器人,代表了日本人形機器人的最高成就。
持續半世紀的孤獨前行
Asimo前前后后迭代了6個(gè)版本。第一階段1986年至1993年,主要攻克機器人下肢運動(dòng)能力,解決雙足運動(dòng)和穩定性的難題。第二階段從1993至2000年,逐漸增加了頭、身體和手臂,此時(shí),可以說(shuō),一個(gè)完整的Asimo雛形初現。此后第三個(gè)階段,本田似乎想要在A(yíng)simo的靈巧手上發(fā)力,機械手(B25J )的專(zhuān)利數量在2003-2008年達到頂峰,占據了本田機器人相關(guān)專(zhuān)利近60%。
最新發(fā)布的Asimo單手有 13 個(gè)自由度,雙手自由度幾乎占到全身自由度的一半,通過(guò)液壓驅動(dòng)實(shí)現精細動(dòng)作,從而能比劃手語(yǔ),在不捏碎杯子的情況下拿起杯子。本田研發(fā)有限公司資深總工程師兼本田人形機器人項目負責人Satoshi Shigemi說(shuō):「很明顯,整體的靈活度是必需的,并因為手部運行能力的提升,它能夠完成更復雜的任務(wù)。
現實(shí)與夢(mèng)想的差距
雖然酷似阿童木的Asimo一出生就受到世界人民的喜歡,但實(shí)際表現卻不能像動(dòng)畫(huà)片里的機器人戰士一樣滿(mǎn)足人們對人形機器人的一切幻想:只能完成“擰開(kāi)蓋子”“倒水”“踢足球”“跑步”這樣的簡(jiǎn)單功能,會(huì )把高舉手機照相的動(dòng)作誤認為“舉手”,然后一直不停地說(shuō)“有什么問(wèn)題要問(wèn)Asimo?”,充滿(mǎn)電后僅能運動(dòng)1小時(shí)。
Asimo更像是一個(gè)宣傳人形機器人的大使,周游全球,這與本田想要機器人服務(wù)老年人的初衷背道而馳。除此之外,300-400萬(wàn)美金的造價(jià),一個(gè)月10萬(wàn)人民幣的租賃費也讓人瞠目咂舌,而目前日本平均護工的工資也不過(guò)1.5萬(wàn)人民幣/月。本田公司機器人相關(guān)專(zhuān)利申請時(shí)間分布,數據來(lái)源:incoPat 專(zhuān)利檢索
雖然Asimo代表了人類(lèi)一個(gè)時(shí)期最強的人形機器人,但高昂的成本、并不成熟的供應鏈體系、差強人意的表現,以及更聚焦細分功能、場(chǎng)景的掃地/服務(wù)機器人等商業(yè)進(jìn)展迅速,最終導致Asimo在2018年退出歷史舞臺。
“地表最強”雙足機器人Atlas,Born in 2013
Atlas,可謂是“流離失所、坎坷一生”。
1992年,學(xué)術(shù)派創(chuàng )業(yè)者M(jìn)arc Raibert院士從麻省理工將Leg Lab 實(shí)驗室(致力于研發(fā)腿式機器人)剝離出來(lái),成立了波士頓動(dòng)力公司。得益于Leg Lab優(yōu)良的腿部運動(dòng)研究基礎,波士頓動(dòng)力獲得了美軍的青睞,旗下人形機器人Atlas的雛形就源自于2009年為美軍測試防護服性能的機器人Petman。
2013年,谷歌母公司Alphabet收購了波士頓動(dòng)力,第一次市場(chǎng)化嘗試卻不如意,一個(gè)想要市場(chǎng),一個(gè)堅持理想,沖突不斷升級,終于,谷歌在2015年關(guān)閉了機器人部門(mén)Replicant,并在2017年將波士頓動(dòng)力賣(mài)給了軟銀。然而,軟銀在愿景基金帶來(lái)的約1.8萬(wàn)億日元(約171億美元)的投資虧損下,也不得不斷尾求生,于2021年將波士頓動(dòng)力賣(mài)給了韓國現代。
追求極致的運動(dòng)能力
為了將運動(dòng)能力做到極致,Altas使用了液壓動(dòng)力裝置,依靠流體動(dòng)力可在狹小空間實(shí)現密集解決方案,特別適合大負載的場(chǎng)合,例如運載火箭的發(fā)動(dòng)機、中國空間對接綜合試驗臺,還有那滿(mǎn)大街的挖掘機??蚣芎屯葎t采用3D打印技術(shù),巧妙的將液壓管道內置在3D打印鈦金屬骨骼內,有點(diǎn)模仿人類(lèi)血管在骨骼內那味兒了。
同時(shí),通過(guò)頭部的搭載的RGB攝像頭和TOF深度傳感器獲取更加全面的環(huán)境信息,利用自創(chuàng )的“軌跡優(yōu)化行為庫"和模型預測控制器(MPC),根據運動(dòng)情況調整其發(fā)力、姿勢、動(dòng)作發(fā)生時(shí)機等細節。
除了秀,還能干啥?
在以上如此優(yōu)異的性能下,劣勢也顯而易見(jiàn)。首先,昂貴。Atlas使用了很多特殊和高成本零部件,一臺造價(jià)就高達200萬(wàn)美金,而同臺跳舞的的機器狗spot雖然售價(jià)不到1/20,也僅售出200來(lái)臺。其次,“嬌嫩”,維護成本高、噪音高、電耗高等。波士頓動(dòng)力也承認,Atlas機器人的可靠性還無(wú)法與機器狗spot相比。最后,寂寞,找不到合適的應用場(chǎng)景。
Asimo、Atlas,雖然相差十三年,但結局卻一樣,高昂的成本、缺失的場(chǎng)景,只能淪為行業(yè)先驅。
02馬斯克的擎天柱,再一次點(diǎn)燃信心
時(shí)間回到2006夏日的一天,馬斯克夢(mèng)到一個(gè)完全自動(dòng)化的未來(lái)制造工廠(chǎng),機器人高速制造所有東西,這些東西被傳送帶在正確的時(shí)間運送到正確的地方。夢(mèng)醒后興奮的馬斯克,宣布特斯拉要用“機器生產(chǎn)機器”,也就是建立全自動(dòng)化工廠(chǎng)模式。
接下來(lái)便是特斯拉眾所周知的“產(chǎn)能地獄”經(jīng)歷。而自動(dòng)化工廠(chǎng)的失敗,并沒(méi)有打消馬斯克對于全無(wú)人工廠(chǎng)的執念,反而播下了量產(chǎn)“工人”的種子。他多次在公開(kāi)場(chǎng)合發(fā)起了牢騷:為什么現在的機器人,都無(wú)法實(shí)現像人手一樣實(shí)現“撿起零件并放置在電池上”這類(lèi)簡(jiǎn)單的任務(wù)。
因此,當人形機器人Optimus發(fā)布時(shí),馬斯克還特意讓機器人演示了一遍這個(gè)動(dòng)作,以表成功。但從效果來(lái)看,Optimus還是落了個(gè)“高開(kāi)低走“的狀況,運動(dòng)能力嚴重落后于公眾預期。不過(guò),它那雙五指靈巧的手,還是值得深究,成為人形機器人商業(yè)落地的一個(gè)重要突破口。
Optimus的“靈巧手”,圖片來(lái)源:特斯拉AI DAY 2022發(fā)布會(huì )預告
研究一雙靈活的手
人手能以每秒300度的速度移動(dòng),擁有成千上萬(wàn)的觸覺(jué)傳感器和21個(gè)主動(dòng)自由度,是人類(lèi)勞動(dòng)最完美的工具。而人類(lèi)對機器人多指靈巧手的研究,則是從假肢開(kāi)始的,作為一個(gè)單獨學(xué)科,已經(jīng)有64年的研究歷史。
目前主流的靈巧手有兩種方式,一種是內置式,即將驅動(dòng)、傳感、控制等所有的驅動(dòng)執行零部件都集成在手掌內。典型代表的靈巧手,是由哈爾濱工業(yè)大學(xué)機器人研究所 (HIT) 和德國宇航中心 (DLR) 合作了20多年共同研發(fā)的,而這個(gè)手掌因為集成零件多,也是普通人手掌的1.5倍大。
另一種,則是外置式。即將體積較大的電機驅動(dòng)器外置在手臂,采用拉線(xiàn)方式從遠端控制靈巧手的關(guān)節。這種方時(shí)和內置相比,成本更低、難度也有所降低。典型代表是英國的shadow hand,而馬斯克的Optimus也采用這種方式。
一歲嬰兒就會(huì )抓取,但對于機器手而言,且不說(shuō)完全比得上人手,即使可以使用,都走了一段半個(gè)世紀的研發(fā)路。那么,馬斯克的Optimus,有什么不同呢?
左右滑動(dòng)查看,驅動(dòng)外置靈巧手代表:英國shadow hand,圖片來(lái)源:Shadow Robot
左右滑動(dòng)查看,典型內置式多指靈巧手:DLR-HIT Hand II 靈巧手,圖片來(lái)源:Institute of Robotics and Mechatronics
人形機器人“第一手”
Optimus的設計靈感來(lái)自于生物學(xué),和人手一樣同樣使用5個(gè)手指,擁有11個(gè)自由度。像拉線(xiàn)玩偶一樣,由5根“經(jīng)脈”(線(xiàn)驅動(dòng)) 獨立控制手指的彎曲和展開(kāi),負重20磅(9KG)和自適應抓?。軌蜃ト〔煌螤?、尺寸的物體)的能力,因此,使得Optimus的手部勞動(dòng)力能夠勝任工廠(chǎng)的一般工作。
手腕則由兩根執行器控制,這個(gè)設計不僅能讓手腕轉動(dòng),還可以做水平的動(dòng)作,這也是目前市面上其他人形機器人鮮有見(jiàn)到的。除此之外,特斯拉還需要將4-5kg左右的電驅手臂集成在雙足機器人上,這對人形機器人的行動(dòng)、操作和精巧抓取都提出了更高要求。
雖然Optimus在技術(shù)領(lǐng)域實(shí)現了提升,但對于人形機器人而言,更重要的話(huà)題是:成本,能夠量產(chǎn)降本才是核心。
量產(chǎn)的突破
馬斯克準備用SpaceX的套路打造機器人,一切都是以規模產(chǎn)業(yè)化為目的,以指數級砍成本。
一方面大量復用特斯拉汽車(chē)現有技術(shù)降維打擊,包括電池、散熱、視覺(jué)避障等。胸腔內安置的2.3kWh的電池,能支撐Optimus工作一整天。這個(gè)耗電量,差不多也是一個(gè)成年勞動(dòng)者一天消耗的能量。另一方面全身都沒(méi)有使用特殊訂制的零部件,而是優(yōu)化了全身 28 個(gè)驅動(dòng)器設計參數,最終采用通用的兩類(lèi)六種伺服關(guān)節(基于無(wú)框力矩電機+諧波減速器的旋轉關(guān)節,基于力矩電機+滾珠絲杠的線(xiàn)性關(guān)節)。而至于Optimus比老人還走的慢,那是因為特斯拉損失了一定響應速度,以降低能耗。
通過(guò)這套流程下來(lái),Optimus的吸引力大增:2萬(wàn)美金一臺、一周工作7天、充電一次工作一整天。而對比之下,美國特斯拉工廠(chǎng)一個(gè)普通工人工資一小時(shí)最少16.2美元,一個(gè)月近6000美元,也就是說(shuō),3個(gè)月普通工人的工資,就能買(mǎi)下一臺一周工作007、不會(huì )請假、不會(huì )抱怨的高效“廉價(jià)勞動(dòng)力”。
而在小批量量產(chǎn)以后,馬斯克還可以將Optimus放在特斯拉超級工廠(chǎng)里,邊工作邊迭代,也許將來(lái)有一天,我們會(huì )看到成千上萬(wàn)個(gè)Optimus在火星上幫人類(lèi)搭建家園。
正是因為有了量產(chǎn)的規劃、手的突破,因此,鋼鐵俠馬斯克,還是給大家帶來(lái)了很多期待。
03技術(shù)的演進(jìn)路徑
人形機器人的發(fā)展還處于突破技術(shù)壁壘的早期階段,導航定位、環(huán)境感知、指令分析、行為控制等關(guān)鍵技術(shù),都還沒(méi)完成從“能用”到“好用”的長(cháng)征,那么,會(huì )有哪些技術(shù)演進(jìn)路徑呢?
雙足行走,不是移動(dòng)機器人的唯一選擇
雙足對于人形機器人來(lái)說(shuō)承擔著(zhù)移動(dòng)的任務(wù)。但相比起來(lái),輪式和四足機器人應用更成熟、成本更小、技術(shù)難度更低。波士頓動(dòng)力曾公開(kāi)表示,目前Atlas將不會(huì )商業(yè)化,真正實(shí)現商業(yè)化的是它的四足機器人。這兒大膽猜測一下,特斯拉的Optimus,是否會(huì )像馬斯克的第一輛電動(dòng)酷炫超跑一樣,目前的雙足只是噱頭,最終產(chǎn)業(yè)化的時(shí)候又會(huì )回到四足或是輪式?
機械手的靈敏度,反映人形機器人的技術(shù)實(shí)力
靈巧手的關(guān)節越多代表越靈活,能做的操作也越多。本田從足部運動(dòng)轉向機械手研究,雷軍公開(kāi)招募靈巧手機械工程師,也說(shuō)明了人形機器人的玩家,開(kāi)始意識到手的重要性。
機器人1.0時(shí)代的代表“機械臂”模仿人手在制造和組裝流水線(xiàn),進(jìn)行著(zhù)無(wú)聊的、重復的、固定的工作;機器人2.0時(shí)代的代表物流機器人,通過(guò)輪子在提前規劃好的路徑移動(dòng),利用視覺(jué)感知獲取信息并判斷,將物品搬運至固定的位置。
這兩個(gè)階段的“手”,也就是末端執行器,可以是帶有噴槍、焊槍的工具,也可以是氣動(dòng)吸盤(pán)(如波士頓動(dòng)力Handle Logistic機器人),又或是模仿人手的夾鉗(如小米鐵大)、三指夾爪等。
而機器人3.0時(shí)代的手,也許會(huì )是布滿(mǎn)了傳感器,通過(guò)感知物體的重量、大小、溫度,采取不同的姿勢和力度對不同形態(tài)的物體實(shí)施抓取,并使物體表面受力比較均勻,再加上頭部的機器視覺(jué)、算法等技術(shù),最終可以像人一樣進(jìn)行更準確的判斷。
智能交互,才是我們期待的未來(lái)
“手”的操作離不開(kāi)“腦”的決策,“智能化+類(lèi)人形+低成本”是機器人發(fā)展的主要趨勢。
機器人研發(fā)一般采用“本體—技能—智能”自下而上的研發(fā)路線(xiàn),從雙腿運動(dòng)逐步擴展到手等功能部件,最后考慮智能化。人形機器人的未來(lái)將是,如何讓人形機器人“更聰明”,面對復雜的跨場(chǎng)景工作模式,要真正地實(shí)現代替人,還需提升AI技術(shù)的感知能力。
目前的 AI 應用層面仍然過(guò)于單點(diǎn)化,只有 AI 能力實(shí)現,實(shí)現由單點(diǎn)智能向全局智能、由認知智能向決策智能的跨越,我們才能與更聰明的AI 機器人頻繁互動(dòng)。而通過(guò)硬件、算力、算法、數據等要素持續迭代升級,實(shí)現人與機器人之間達到人和人之間的交互體驗,這也是終極人形機器人商業(yè)化發(fā)展的重要一步。
04結語(yǔ)
一款真正能成功產(chǎn)業(yè)化的產(chǎn)品,除了技術(shù)的成熟、成本的降低,最重要的還要有足夠廣闊的落地場(chǎng)景:例如二維碼,也是在技術(shù)成熟15年后,才在微信“掃一掃加關(guān)注”這個(gè)場(chǎng)景下,得到了前所未有的應用。
而機器人行業(yè),會(huì )有一道共性難題:標準化生產(chǎn)、和非標準化的應用場(chǎng)景。標準化、大規模生產(chǎn),才有助于降低成本;但要實(shí)現大規模,場(chǎng)景必然會(huì )擴大,于是又會(huì )面臨許多非標準化的需求。這是機器人不同領(lǐng)域、不同公司都要平衡的要素。
縱觀(guān)目前大規模應用的各類(lèi)機器人,能快速實(shí)現商業(yè)落地的,大多有幾個(gè)特點(diǎn):功能單一、使用場(chǎng)景固定、需求清晰,比如工業(yè)機械臂、掃地機器人等。而人形機器人既有優(yōu)勢、又有劣勢,更需要對矛盾“把玩琢磨”。
一方面,人形機器人的天然優(yōu)勢在于其通用性。集成功能多、終極通用裝置,一款成熟的產(chǎn)品即可適用于廣泛的需求場(chǎng)景,不再有傳統“工業(yè)機器人”、“服務(wù)機器人”這樣明確的功能屬性。因而,具備標準化、大規模生產(chǎn)的基礎,可以快速降本。
但,另一方面,正是因為哪里都能用,所以,也有可能會(huì )顯得,哪里都不是最好用,或者說(shuō),有些功能是冗余的。因此,找到場(chǎng)景就很關(guān)鍵。
比較之下,工業(yè)場(chǎng)景也許是人形機器人邁向產(chǎn)業(yè)化的第一塊陣地。工業(yè)場(chǎng)景,既有需求,可以將人類(lèi)從繁重、危險的“4D”工作中解放出來(lái);又具備一定通用性,適配部分工業(yè)場(chǎng)景領(lǐng)域分散、各自規模較小的問(wèn)題。同時(shí),在經(jīng)濟性上,相對于C端客戶(hù),工業(yè)場(chǎng)景的支付意愿、能力也更高。
人形機器人,技術(shù)在不斷突破新高,但人類(lèi)的需求也在不斷豐富、復雜。這是一場(chǎng)供給和需求的賽跑、技術(shù)和商業(yè)的較量,前后者之間,似乎就像程序員永遠跟不上產(chǎn)品經(jīng)理的步伐一樣。但幸運的是,技術(shù)的發(fā)展,并非線(xiàn)性,奇點(diǎn)之后就會(huì )有極大跨越。
也正因此,在大眾紛紛失望嘆氣之時(shí),人形機器人領(lǐng)域創(chuàng )業(yè)者和投資人們,依然會(huì )在心里打氣:這是“長(cháng)坡厚雪”。
來(lái)源:遠川科技評論
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。