人形機器人:實(shí)現批量應用的瓶頸技術(shù)是什么
為了實(shí)現稍微批量一點(diǎn)兒的人形機器人,例如上千臺、上萬(wàn)臺的應用,真正能夠創(chuàng )造價(jià)值,而不是給人看的應用,其瓶頸技術(shù)在哪里?中國工程院外籍院士、德國國家工程院院士、德國漢堡大學(xué)教授張建偉發(fā)問(wèn)道。
本文引用地址:http://dyxdggzs.com/article/202409/463392.htm在8 月24 日“探索人形機器人新紀元:創(chuàng )新、挑戰與機遇”論壇之前,已有幾位中外專(zhuān)家提到了具身智能的數據、能源、材料、關(guān)鍵零部件等問(wèn)題。那么,從各廠(chǎng)商的具體實(shí)踐角度,還有哪些瓶頸技術(shù)問(wèn)題?有哪些突破的建議?
圖:“探索人形機器人新紀元:創(chuàng )新、挑戰與機遇”論壇
1 已“能跑會(huì )跳”,還需“心靈手巧”
智昌公司董事長(cháng)兼總經(jīng)理、復旦大學(xué)教授甘中學(xué)指出,現在把人形機器人真正用到實(shí)踐中,不管是用于工業(yè)、服務(wù)業(yè),還是其他特種行業(yè),還是有差距的。
如果把機器人分成三大類(lèi):一類(lèi)是能跑會(huì )跳的,代表性企業(yè)有宇樹(shù)科技等;有的心靈手巧,例如北京因時(shí)機器人公司;還有情感類(lèi)的。
目前工業(yè)和服務(wù)業(yè)的一種比較關(guān)鍵的技術(shù)是心靈手巧技術(shù),只有把心靈手巧做好,才能在工業(yè)界實(shí)現大部分的復雜動(dòng)作,服務(wù)業(yè)也能照顧人。
目前在“能跑會(huì )跳”方面,很多企業(yè)已做得不錯了,但是在“心靈手巧”上,還不夠實(shí)用。無(wú)論是特斯拉還是國內做的,手的動(dòng)作跟人的動(dòng)作比還相差甚遠。
2 能耗、仿生肌肉骨骼、人機物的接觸安全性
在落地能用的挑戰方面,月泉仿生公司聯(lián)合創(chuàng )始人、吉林大學(xué)唐敖慶講席教授總結如下。
①能耗的問(wèn)題。月泉的能耗技術(shù)已經(jīng)降到了原來(lái)傳統機器人能耗的1/30,接近于1/32,很接近人的能耗了。
②手和手臂是真正決定機器人能夠完成什么任務(wù)的關(guān)鍵。但是人手的技術(shù)還差得非常多,為此,月泉提出了一項新技術(shù):“仿生拉壓體”機器人技術(shù)。它是按照人的肌肉骨骼的作用原理來(lái)做的,把關(guān)節完全放開(kāi)了,而且它的驅動(dòng)是采用人工肌肉式的驅動(dòng)——月泉專(zhuān)利的磁驅動(dòng)的電氣人工肌肉,即對于所有關(guān)節,都恢復了人體的自然生理運動(dòng),膝關(guān)節的自由度高達12 個(gè),而現在的人形機器人的膝關(guān)節一般只有1 個(gè)自由度,但月泉的完全放開(kāi)了,大腿骨和小腿骨是6 個(gè),髕骨和大腿是6個(gè)自由度。放開(kāi)之后,原來(lái)覺(jué)得可能比較難,現在迎刃而解,這樣能夠真正呈現人體自然的行走步態(tài),而且能耗有顯著(zhù)的下降。
③必須在批量生產(chǎn)或落地之前解決的一件大事是人- 機- 物的接觸安全性。這非常重要,因為走進(jìn)家庭、和人類(lèi)協(xié)同工作后,接觸安全性非常重要。如果是金屬的剛性部件,高速運動(dòng)起來(lái)跟人近距離接觸是非常危險的,而且對于貴重的儀器設備、家電、家具等都是不太友好的。所以現在提出一個(gè)概念:像人一樣。因此一定要采用剛柔耦合的結構去解決。這樣,它跟人接觸時(shí),你感覺(jué)就像另外一個(gè)人。而且周邊的環(huán)境,包括人跟它近距離接觸不會(huì )有恐懼感。
3 眼、手和小臂技術(shù)很重要
小米集團技術(shù)委副主席、手機部副總裁、機器人公司總經(jīng)理許多說(shuō),要進(jìn)入規?;瘧?,是三者的平衡:
①精度,決定了能不能有效地完成。②速度,決定了效率,是商業(yè)成功很重要的因素。③負載,決定能干多少工作,例如在汽車(chē)工廠(chǎng),搬運的東西從很輕的到可能一二十公斤,變化范圍較大,要用一個(gè)通用的本體實(shí)現,壓力還是很大的。
回到核心技術(shù),要解決三個(gè)核心部件的問(wèn)題。
①眼?,F在市場(chǎng)上大部分還是想用純視覺(jué)RGB 去解決,但是到底數據規模會(huì )到多少,其精度才能提升?1 條、11 條?現在還在探討。至少現在的1 條用生成數據訓練的純視覺(jué)模型,精度大概還是厘米級,沒(méi)有像人們期待的亞毫米級。因為在工業(yè)上用的還是要用亞毫米精度去收斂,這時(shí)還是需要主動(dòng)雙目。因為主動(dòng)雙目能提供穩定的亞毫米的空間點(diǎn)云信息,至少目前暫時(shí)是需要的。亞毫米空間點(diǎn)云這種主動(dòng)雙目的機械視覺(jué)部件需要怎么去做?是今天產(chǎn)業(yè)界非常核心的一個(gè)問(wèn)題。
②靈巧手。人們在探討3 指還是5 指。工業(yè)用3 指比較合適。因為5 指有點(diǎn)多余,且5 指用推桿電機的方式,對可靠性有挑戰?,F在的靈巧手還是很容易壞的,負載大一點(diǎn)兒就容易壞。
③小臂?,F在大臂是走工業(yè)的這一套路,基本上走25°的斜坡,拿約7~10 公斤是沒(méi)有問(wèn)題的。但小臂使整個(gè)載重能力急劇下降,因為小臂要協(xié)同速度和精度,這對小臂的犧牲是比較大的。能否在小臂設計上有所突破?非常期待任雷教授(月泉、吉大)的完整臂產(chǎn)品給人們去試用。因為現在用傳統的諧波方式做的小臂有非常多的問(wèn)題,要么做得很重。因為人形的腿部電機確定了之后,例如設計的是100 公斤、可以0.5 米/ 秒的速度行走,若臂的重量節省下來(lái),余下就是給載重的。如果腿、臂做得越輕,例如做到70 公斤,就有可能有30公斤的載重空間;如果做到80 公斤,就只剩20 公斤。因此小臂的影響是非常大的。
可見(jiàn),眼睛、手、小臂是未來(lái)人形機器人進(jìn)入批量供應非常核心的技術(shù)。工業(yè)應用是高精度、高速度的。若往民用去拓展,就要解決任雷教授(月泉、吉大)提到的接觸安全問(wèn)題,但這相對比較容易解決,還是要先解決精度和速度的問(wèn)題,再去解決接觸安全的問(wèn)題,加上各種力控——這些相對比較容易。
4 實(shí)現“技術(shù)產(chǎn)品市場(chǎng)匹配”,進(jìn)行一輪輪迭代
如果批量使用,不一定是純技術(shù)的問(wèn)題。就像移動(dòng)互聯(lián)網(wǎng)時(shí)代經(jīng)常提到一個(gè)詞——PMF(產(chǎn)品市場(chǎng)匹配),到機器人可能叫TPMF(技術(shù)產(chǎn)品市場(chǎng)匹配),因為有些前沿的技術(shù)需要去突破,但如果要實(shí)現量產(chǎn),可能是有市場(chǎng)需求。市場(chǎng)需要什么樣的產(chǎn)品?這個(gè)產(chǎn)品需要什么樣的技術(shù)?然后把這些匹配度做高。這可能是最先能批量生產(chǎn),并且形成商業(yè)化規模的關(guān)鍵。
我們正處在第一輪的“技術(shù)產(chǎn)品市場(chǎng)匹配”階段,這一輪從電驅的關(guān)節,包括無(wú)論是直線(xiàn)的還是旋轉的,然后結合現在的算力的主控,包括結構也在快地形成標準統一??赡艿谝惠喌募夹g(shù)已經(jīng)成熟,接下來(lái)就看把它包裝成什么產(chǎn)品,然后打什么市場(chǎng),正好能夠匹配上,例如讓它踢球、搬運、進(jìn)入家庭。當然,盡管家庭的需求度比較高,但目前的挑戰還比較大。因此,“加速進(jìn)化”會(huì )傾向于選一些偏簡(jiǎn)單的場(chǎng)景,對技術(shù)要求沒(méi)那么高的,盡快把第一輪的技術(shù)產(chǎn)品市場(chǎng)匹配走完,然后再走第二輪。
第二輪可能需要更高的技術(shù),能做出更好的產(chǎn)品,能滿(mǎn)足更復雜的需求。
這樣一輪輪迭代,可能是接下來(lái)發(fā)展的節奏。
5 “影子模式”和更為復雜的“自動(dòng)駕駛”
松延動(dòng)力(北京)公司聯(lián)合創(chuàng )始人、CEO 張世璞從控制和智能的角度分析如下。
①從硬件方向看,過(guò)去的半年時(shí)間會(huì )發(fā)現,當1.0版本時(shí),能夠讓它穩定地行走、奔跑;但是當強化學(xué)習、再去迭代時(shí),再去測試跑和跳的過(guò)程時(shí),又會(huì )暴露出新的問(wèn)題。因此松延動(dòng)力在思考能否去借鑒其他商業(yè)模式,例如車(chē)企的“影子模式”,把無(wú)論是后面的量產(chǎn)還是前面的研發(fā)體系量化,而且還能很好地去發(fā)現這次demo里的bug,怎樣去debug。因為人們都在談黑盒算法是黑盒,但實(shí)際上研發(fā)從某種程度上看,它的范式也存在一個(gè)黑盒,所以可能“影子模式”是一種比較好的方式去解決這個(gè)問(wèn)題。
②在商業(yè)化過(guò)程中,不管是去工廠(chǎng)還是去服務(wù)業(yè),還是去2c,自動(dòng)駕駛是最重要的一環(huán),因為不可能再讓一個(gè)人站在它后面拿著(zhù)手柄去遙控機器人?,F在人們再去解決的一件事是“自動(dòng)駕駛”,但這并不是簡(jiǎn)單的從一個(gè)位置到另一個(gè)位置,它的姿態(tài)也在發(fā)生變化。所以怎樣能夠把感知、視覺(jué)和強化學(xué)習結合在一起,能夠讓它很穩定、魯棒地做到自動(dòng)駕駛,是松延動(dòng)力正在突破的一個(gè)方向。
6 能源和電機是關(guān)卡
樂(lè )聚董事長(cháng)冷曉琨稱(chēng),該公司今年在探索人形機器人進(jìn)入到場(chǎng)景化、產(chǎn)業(yè)化時(shí)也在探討這個(gè)問(wèn)題,該公司已走到二個(gè)階段。
● 第一階段,今年樂(lè )聚銷(xiāo)量最高的場(chǎng)景還是科研展廳和高校,約100 多臺。過(guò)去一年基本把這方面的問(wèn)題解決得差不多了。
● 現在第二步是進(jìn)入工業(yè)場(chǎng)景,包括跟幾家國內外車(chē)廠(chǎng)簽了協(xié)議。這時(shí)遇到了一些新問(wèn)題,并且不是人形機器人公司能搞定的。
其中一個(gè)是能源問(wèn)題,現在大部分人形機器人的續航時(shí)間在1.5~2 小時(shí),采用換電的方式也不太夠用,因為它的工作節拍很快,難以頻繁換電。電池容量問(wèn)題是涉及基礎學(xué)科的問(wèn)題,在基礎學(xué)科沒(méi)有突破之前,我們要怎么來(lái)解決?這是產(chǎn)業(yè)上急需解決的挑戰。
第二個(gè)是電機的功率密度問(wèn)題。實(shí)際上在工業(yè)機器人時(shí)代,業(yè)界就在討論這個(gè)問(wèn)題。例如100 公斤的機械臂拉一個(gè)10 公斤的物品,如果有一天10 公斤的機械臂能拉動(dòng)100 公斤物品時(shí),很多控制、智能算法等會(huì )有一個(gè)很大的提升幫助。同樣,人形機器人是一個(gè)欠驅動(dòng)的系統,所以電機的功率密度問(wèn)題也是一個(gè)很大的需求點(diǎn)。但是電機每次的功率密度提升是以2%、5% 的方式,很難有一個(gè)很大的質(zhì)的突破,因此會(huì )影響接下來(lái)人形機器人產(chǎn)業(yè)化的落地。
因此,能源和電機問(wèn)題接下來(lái)會(huì )較長(cháng)時(shí)間地卡住人形機器人的發(fā)展。
7 “研發(fā)批量技術(shù)”
智平方創(chuàng )始人兼CEO 郭彥東稱(chēng),智平方的定位是面向產(chǎn)業(yè)的,因此在思考怎樣去研發(fā)批量的技術(shù),推出了“通用智能機器人”。
要想在量產(chǎn)中使用“通用智能機器人”,所要思考的問(wèn)題跟在實(shí)驗室是非常不同的。智平方要投入在哪些核心技術(shù)上?
第一,“通用且精細”,或者稱(chēng)為“通用且稠密的感知”。實(shí)際上,智平方在成立之初就重點(diǎn)投入這個(gè)方面??赡苡腥擞X(jué)得業(yè)內的感知已經(jīng)做了很多年,甚至在實(shí)驗室已經(jīng)有了非常好的成果。但是無(wú)論是在量產(chǎn)汽車(chē)還是量產(chǎn)手機的時(shí)候會(huì )發(fā)現,當環(huán)境多變時(shí),想要在通用的場(chǎng)景下實(shí)現非常精細化的感知,是一大核心挑戰。因此,智平方在成立之初,就把通用且精細的感知列為最核心的技術(shù),并且在這個(gè)方向取得了一定的進(jìn)展,也得到了國家及客戶(hù)的一些認可。
一些友商也有類(lèi)似的看法。例如小米的許多總經(jīng)理曾提到,以及硅谷的一些人形機器人公司火了一段時(shí)間之后,也都回頭認為空間感知是機器人里最核心的問(wèn)題之一。
第二,泛化操作。機器人不做大規模量產(chǎn)時(shí),人們可能不會(huì )意識到操作的泛化是一個(gè)非常重要、一定要做的問(wèn)題,包括端到端的架構。如果只是做一個(gè)原型,用代碼去實(shí)現的效率是更高的。但是如果這種設備在生產(chǎn)實(shí)踐中持續地使用,隨著(zhù)設備量的增大,以及環(huán)境的多變等情況,需要適應的操作/ 任務(wù)越來(lái)越多,要寫(xiě)的代碼就越來(lái)越多??梢?jiàn),在討論是否要做端到端的這種大背景和前提下,如果把它放到要去批量的大背景下,就容易有一個(gè)非常有傾向性的答案。
第三,軟硬整合能力。因為郭彥東先生在主機廠(chǎng)做過(guò)負責人,不管叫自動(dòng)駕駛還是AI 中臺,實(shí)際上,在主機廠(chǎng)做AI 和普通的做AI 還是很不一樣的。例如2016、2017 年時(shí),Robotaxi 公司把PC 機放在汽車(chē)后備箱里去做展示,到真正在量產(chǎn)的汽車(chē)里去做智能化,遇到的挑戰是:怎樣把算法跑在一個(gè)算力受限的端側芯片上?怎樣去適應量產(chǎn)裝置的不完美?并不是如果發(fā)現硬件裝置這個(gè)地方不是最好,我就花一兩億元/ 通過(guò)投資研發(fā)把它做好。實(shí)際上,我們要做的是如何在現有硬件性能的基礎上,把智能和軟件的能力發(fā)揮到極致。這是一個(gè)非常經(jīng)典的、帶有主機廠(chǎng)色彩的“研發(fā)批量技術(shù)”的思考。
8 感知、取舍、可用及成本的挑戰
大連蒂艾斯公司聯(lián)合創(chuàng )始人、總裁李博陽(yáng)指出,我們做任何的智能決策或服務(wù),感知是第一步。但機器人的感知能力目前還有很大的欠缺。
不僅是空間感知,還包括對自身、本體狀態(tài)的感知,包括跟客戶(hù)/ 使用者之間的關(guān)系感知,以及跟周?chē)h(huán)境、應用場(chǎng)景的感知。
我們人能夠做出恰當、準確的反饋,是基于充分感知到了所處的環(huán)境,以及我們現在應該做什么?,F在的感知階段往往從語(yǔ)音、傳感器等方式獲取一些信息,但是跟人相比還遠遠不夠。
從機器人廠(chǎng)商角度,提到批量化時(shí),考慮的問(wèn)題比較多。
首先,做取舍:應該在什么場(chǎng)景下做出一個(gè)可批量化生產(chǎn)的產(chǎn)品?首先這個(gè)市場(chǎng)是真的有這個(gè)需求嗎?如果做的是一個(gè)偽需求的項目,不管怎么做,都不可能有批量化的可能性。
其次,可用性。我們的產(chǎn)品要在這種需求狀態(tài)下如何達到可用的狀態(tài)?就是可以達到我們希望它達到的效果?,F在很多機器人企業(yè)做出來(lái)的產(chǎn)品在需求場(chǎng)景下還沒(méi)有達到真的可用的狀態(tài),這就意味著(zhù)它現在還沒(méi)有到量產(chǎn)的階段。
再有,成本。如果量產(chǎn),不管是零部件還是日常使用的算法,或者是大模型的支出,都應該是在成本可控的范圍內。
當然,現在考慮這個(gè)問(wèn)題還為時(shí)過(guò)早,現在還是一個(gè)百花齊放的階段,可以先不去考慮量產(chǎn),而是先考慮怎么能讓機器人達到在應用場(chǎng)景下可以用,并且賣(mài)得出去,然后再考慮去降成本、批量化的問(wèn)題。
9 高性?xún)r(jià)比的本體與有趣的靈魂
深圳市眾擎機器人公司創(chuàng )始人兼CEO 趙同陽(yáng)把人形機器人分為4 大部分:優(yōu)秀的本體,高動(dòng)態(tài)性能的理論控制算法,更具有泛化性的具身智能,非常接近人的通用AI。實(shí)際上,目前每一部分的落地都有巨大的挑戰。
①本體?,F在人們都走電動(dòng)方案,電動(dòng)方案不管從電機減速機還是到控制器,都屬于傳統行業(yè)。盡管手已在機械臂等行業(yè)經(jīng)過(guò)一定的驗證,但是在人形機器人上使用還是第一次。所以機器人未來(lái)做到工業(yè)級別,成本至少需要10~12 萬(wàn)元。希望其價(jià)格接近汽車(chē),還要具有10~15 年的壽命。如果家庭買(mǎi)一個(gè)機器人要10~18 萬(wàn)元,可能希望能工作10 年以上。所以它對耐久性、可靠性要求是很高的,非常具有挑戰性。
另外,人形機器人不像機器狗,狗走出什么樣的步態(tài)無(wú)所謂,只要能往前走、走得快就行了。但是對于人形機器人,希望走得平穩、快,最終要走出優(yōu)雅的步態(tài)?,F在很多機器人走起來(lái)嘩嘩響、小碎步、曲著(zhù)腿,這都不是人們希望看到的,希望像人一樣走得虎虎生威或非常優(yōu)雅,因此行走不僅是一門(mén)技術(shù),還是一門(mén)藝術(shù)。至于達到藝術(shù)級別的時(shí)間點(diǎn),可能還需要至少一兩年的時(shí)間去做準備。
②在解決完運動(dòng)控制算法和本體后,在通用AI 部分,希望機器人不僅有很好的軀體,還需要有足夠有趣的靈魂。這一部分可能是機器人行業(yè)后面非常大的一個(gè)坑,可以類(lèi)比以前的個(gè)人計算機(PC)時(shí)代:PC 時(shí)代很多廠(chǎng)商在做電腦硬件的時(shí)候,微軟做了軟件平臺。所以對于通用機器人,不僅要關(guān)注到本體,可能還會(huì )有一家巨型公司成為未來(lái)的微軟,不管誰(shuí)家的機器人,搭載它的智能之后,會(huì )立即變得具有靈魂。
最近,趙同陽(yáng)和一些做大模型的公司交流。大模型公司正在經(jīng)歷“百模大戰”,技術(shù)發(fā)展得令人驚訝,但是很多公司在做大而全的技術(shù)——無(wú)所不知,像百科全書(shū)。機器人需要成為一個(gè)萬(wàn)能的上帝嗎?不一定。但是,現在很多大模型的服務(wù)器里可能就住著(zhù)一個(gè)萬(wàn)能的上帝——無(wú)論你問(wèn)什么樣的問(wèn)題,他的回答都十分全面,但是這也造成了比較雷同。所以希望今后隨著(zhù)大模型的發(fā)展,每個(gè)機器人都有各自的性格,是“有趣的靈魂”。
(本文來(lái)源于《EEPW》202409)
評論