褚君浩院士:人形機器人的感知發(fā)展與探索
感知能力是機器人智能的一個(gè)重要前提。2024 年4月初,“2024 中國人形機器人生態(tài)大會(huì )”在上海舉行。大會(huì )由中國機器人網(wǎng)和上海智能谷主辦。會(huì )上,中國科學(xué)院院士褚君浩首先做了“人形機器人感知技術(shù)的發(fā)展與探索”的報告,主要涉及三個(gè)方面:①智能時(shí)代與機器人,②部分傳感器的研究進(jìn)展,③人形機器人的感知功能。
本文引用地址:http://dyxdggzs.com/article/202406/459713.htm1 智能時(shí)代與機器人
現在人工智能(AI)大模型發(fā)展很快,通過(guò)輸入一段文字,就能自動(dòng)生成相應的視頻。那么反過(guò)來(lái)行不行?一段視頻能否變成文字,并且由語(yǔ)音播報出來(lái)?可能也行。這樣對盲人就很有用處,盲人帶上這種設備,把視頻拍下來(lái)并解說(shuō)出來(lái),盲人就知道周?chē)那闆r了。
最近還出現了腦機接口,這意味著(zhù)什么?會(huì )帶來(lái)什么樣的影響?可能帶來(lái)很多影響,例如:
1)醫療能力爆炸。腦機接口技術(shù)有助于精準地調節大腦的化學(xué)物質(zhì),治療抑郁癥、焦慮癥等心理疾病,甚至在更高級別上控制和優(yōu)化人類(lèi)的情感。
2)超感官體驗大爆發(fā),人類(lèi)的感官和認知能力可以得到增強,例如可以直接從大腦接收和傳遞信息,提高記憶力。
AI與動(dòng)作結合方面的發(fā)展很快,例如Figure AI公司的機器人,行動(dòng)可以結合與人的對話(huà)。
可見(jiàn),現在我們正從信息化時(shí)代向智能化時(shí)代邁進(jìn)。智能時(shí)代的技術(shù)趨勢有5 個(gè):
1)智能化分布式能源系統、低碳技術(shù)、能源互聯(lián)網(wǎng);
2)智能化復雜體系、AI、智慧城市、ChatGPT、Sora;
3)智能化制造技術(shù)、先進(jìn)材料、智能化升級傳統工業(yè);
4)智能化診斷、修復技術(shù)、智慧醫療;
5)腦機接口科學(xué)、AI for Science、AI融入物理世界。這5個(gè)方面將來(lái)有很多工作將由機器人/ 人形機器人取代。
智能化系統涉及多學(xué)科,向多領(lǐng)域應用、多方向延展,是科學(xué)與技術(shù)交叉推動(dòng)的。例如同濟大學(xué)TJArk( 同濟方舟) 團隊的足球機器人(注:2014-2023年蟬聯(lián)RoboCup中國賽冠軍)“看”得見(jiàn)球,因為有動(dòng)態(tài)感知的五官;“大腦”能分析球從哪里過(guò)來(lái);能采取措施處理球,所以是一種典型的智能化的人形機器人。一些聊天機器人也是如此:可以得到信息,經(jīng)過(guò)分析再跟人對話(huà)。所以智能化的系統,諸如AI賦能的工業(yè)機器人、服務(wù)機器人、下棋機器人、手術(shù)機器人、ChatGPT、Sora等都屬于智能機器人。
2 部分傳感器的研究進(jìn)展
傳感器有很多種,諸如光、聲、電、磁、熱、機械、化學(xué)傳感器,將來(lái)這些傳感器有望安裝到人形機器人上。因為人形機器人和機器人一樣,要有信息感知,此外,還有大腦分析,最后還要有控制。
現代信息傳感器很豐富, 例如紅外、紫外、x 光、γ射線(xiàn)、壓力、振動(dòng)、聲響、電磁、化學(xué)、生物、單光子等,同時(shí)還有多頻譜范圍的傳感技術(shù)。還要發(fā)展單細胞、單分子、單原子、單光子信息傳感技術(shù)。
有了傳感器以后就得到了大數據。大數據是做分析的基礎。AI的三個(gè)核心要素是數據、算力、算法,可見(jiàn)首先要有數據。而數據是靠傳感器得到的,不是文本大數據,而是傳感器實(shí)時(shí)采集的數據,可見(jiàn)傳感器至關(guān)重要。
2.1 慧眼—光學(xué)傳感器
從光學(xué)/ 紅外的角度來(lái)看,要做慧眼——能夠全天候拍照,非接觸測溫,通過(guò)光譜設備,最終希望能有孫悟空、二郎神那樣的慧眼。
以電磁波家族的重要一員——紅外線(xiàn)為例,紅外傳感器有兩種形式:光熱型,光子型。這兩種形式有三大功能,圖像(空間分布),熱像(溫度分布),譜像(光譜分布)。
1)圖像。特點(diǎn)是可以在黑暗背景中識別圖像,因此可以全天候拍照。在安檢時(shí),可以穿過(guò)人體,看人身上是否攜帶違禁物品——盡管x 光也可以做這件事,但是紅外線(xiàn)對人體沒(méi)影響。最近發(fā)生的俄烏戰爭,也用到了紅外制導。
如果紅外傳感器放在氣象衛星上,就可以白天和夜晚“看”到風(fēng)云變化,使氣象預報/ 臺風(fēng)預報很準確。例如我國的“風(fēng)云4 號”氣象衛星具有寬光譜探測分析系統,可在3 萬(wàn)6 千公里外對大氣層實(shí)現高精度溫度、濕度參數的垂直結構觀(guān)測,相當于對大氣層進(jìn)行CT掃描。
2)熱成像。因為對溫度測得非常準確,而且是非接觸式的,可以穿過(guò)煙霧,探測火焰溫度分布。還可以發(fā)現夜里哪里有排污泄漏,哪里有電路短路,哪里的電子元器件失效了。
例如2019年巴黎圣母院失火,我國大疆公司制造的兩架無(wú)人機進(jìn)行了輔助觀(guān)測,由于上面有紅外相機,精準地“看”到哪里著(zhù)火,從而幫助高效地把火苗滅掉。
3)譜像。光譜特征像指紋特征一樣——每個(gè)人的指紋不一樣,不同的材料/ 物質(zhì)的光譜也是不同的,因此可以識別很多材料。
就像我們采集指紋一樣,首先要做好數據庫,然后就可以分析了。例如稻田的畝產(chǎn)可以達多少斤,通過(guò)光譜收集后,跟數據庫一比對就可以預判。找礦也可以采用同樣的方法,例如找鈾礦,首先讓無(wú)人機飛過(guò),采集的光譜與鈾礦的數據庫進(jìn)行對比就可以了。這種探測方法還可以用在月球和火星的勘探上——月球車(chē)和火星車(chē)上放了紅外探測器,能采集光譜,就可分析星球表面的成分。
在生活中,這種“慧眼”的應用場(chǎng)景很多,例如“看”衣服的材質(zhì),知道衣服的棉、麻、滌綸等的比例。如果把目標對象改成人體,可以看到人體器官的結節,用于病理診斷。
機器人上也可以裝上各種傳感器,來(lái)獲得人行動(dòng)的一些信息,例如對抑郁癥的診斷,通過(guò)瞳孔、腦電、表情、行為等影像來(lái)判定抑郁癥的嚴重程度。例如北京理工大學(xué)醫學(xué)技術(shù)學(xué)院的胡斌教授團隊做了一種小設備“精神狀態(tài)評估與干預系統設備”,如果這種小設備放在人形機器人上,可以邊走邊看周?chē)娜耸欠窕加幸钟舭Y,如果有,嚴重程度如何。
2.2 狗鼻子—化學(xué)傳感器
現在還有氣體傳感設備,例如氣體分子傳感器可探測沙林毒氣與炸藥。通過(guò)熒光猝滅效應,正常時(shí)可發(fā)出熒光,但是如果有TNT,熒光就猝滅了,用這個(gè)原理可以做成TNT 報警器。有 時(shí)狗不能發(fā)現炸藥,但是用“狗鼻子”產(chǎn)品來(lái)一照就能發(fā)現,這種“狗鼻子”可做得很小。這種嗅覺(jué)也是非常重要的。如果人形機器人能夠有嗅覺(jué),將非常有用。所以嗅覺(jué)現在也是一個(gè)研究的熱點(diǎn)。
3 傳感器賦能機器人/人形機器人
智能時(shí)代的機器人要有4 種模塊:環(huán)境感知模塊,智能芯片模塊,運動(dòng)控制模塊,操作系統模塊。
環(huán)境感知就是靠傳感器。所以真正的人形機器人應該能夠具有人的五官的特點(diǎn),能夠感受圖像、壓力、聲音等。例如機器人被人推一下,能馬上站穩,說(shuō)明上面有傳感器。如果觸碰它的手,它應該有觸覺(jué)反應。
傳感器有很多種。
1)力矩傳感器。
2)觸覺(jué)/ 壓力傳感器,其中有壓阻型、壓電型、壓容型的、摩擦電型。MEMS 壓力傳感陣列已成熟,柔彈性的電子皮膚正在新興發(fā)展。
所以人形機器人中,非常重要的是要研究它的元部件及功能,每個(gè)元部件都要研究的水平很高,再集成起來(lái)功能就強大了。例如上海大學(xué)自主設計并異質(zhì)集成出首款基于氧化物TFT 的64 通道肌電傳感器陣列,實(shí)現了高信噪比(37.5 dB),多通道手勢識別率高達97.4%,可以用在假肢上。
3)視覺(jué)傳感器。可以有激光雷達、深度相機、雙目視覺(jué),研究的熱點(diǎn)有感算一體、仿生感光、低功耗芯片,市場(chǎng)規模非??捎^(guān),預計國內2025 年有347 億元,在國外有1276 億元的市場(chǎng)規模。
4)慣性傳感器:加速計+ 陀螺儀是測量加速度、角速度、傾斜角度的重要方法??梢赃M(jìn)行姿態(tài)控制,是雙足行走的關(guān)鍵部件。集成磁傳感器進(jìn)行定位,發(fā)展了慣導傳感器。機器人中需要多個(gè)這類(lèi)傳感器,但產(chǎn)品主要被國際寡頭壟斷,我國頭部企業(yè)在全球市場(chǎng)的份額不足2%。
人形機器人里需要大量的傳感器,需要產(chǎn)學(xué)研結合,把每個(gè)部件都能研究好,而且做出來(lái)。
進(jìn)博會(huì )有很多機器人的應用案例,例如2022 年美敦力做的機器人輔助手術(shù)系統,波士頓科學(xué)做的植入式腦神經(jīng)刺激系統,愛(ài)靈必的仿生手,還有歐姆龍第七代乒乓球教練機器人等。在A(yíng)I 方面,2019 年英飛凌推出了Roboy機器人,具有聽(tīng)視覺(jué)和感知的神經(jīng)網(wǎng)絡(luò )系統,德國卡赫的AI智能清潔機器人,還有蔡司的數字導航手術(shù)顯微鏡ARTEVO 800,2021 年強生推出的數字化手術(shù)平臺等很多數字化手術(shù)平臺。
機器人/人形機器人的發(fā)展方向是要有一定的場(chǎng)景應用,把核心、基礎的元器件要做好,然后進(jìn)行集成。場(chǎng)景可以是“服務(wù)機器人+ChatGPT”的方式。例如“掃地機器人+ChatGPT”對話(huà),也許很受歡迎,因為我國是老年社會(huì ),年紀大的人養條狗很麻煩,買(mǎi)個(gè)機器人,只要價(jià)格在1 萬(wàn)~10 萬(wàn),生意可能很好。
醫療機器人的用途更多,可以是手術(shù)機器人、康復機器人等。
教育機器人:家長(cháng)買(mǎi)回來(lái)以后,小孩不用去培訓班了,它跟小孩說(shuō)話(huà),幫助小孩學(xué)習,一道題做錯了,知道小孩哪些知識點(diǎn)沒(méi)掌握好。
所以產(chǎn)品一定要和場(chǎng)景結合。再例如,消防員的工作很危險,汽車(chē)制造廠(chǎng)的噴漆工作辛苦,希望由機器人替代。消防員機器人的“衣服”不怕火燒,眼睛是紅外的,在煙霧里能知道火源在哪里,而且在煙霧里也能看見(jiàn)人。
人形機器人有三大支柱:感官- 識別,大腦- 分析,四肢- 行動(dòng)。需要把這三大方面的元部件做好,然后把感知、分析、行動(dòng)融合,集成到人形機器人里。但是不可能做成一個(gè)完人——像我們人一樣,能下象棋,回到家里還能燒飯燒菜——這是完整的智能。人形機器人希望先做成部分智能,能做好一兩件事。
1) 程序化人形機器人,從單一的功能擴展到多功能。
2)智能化人形機器人,從單一智能發(fā)展到多智能。要發(fā)展場(chǎng)景牽引的動(dòng)作與對話(huà)相結合的智能化人形機器人,例如家務(wù)機器人、教學(xué)機器人、消防員、交通警、士兵、值班員、駕駛員、操作員、乒乓球教練等。如果針對某一場(chǎng)景,只具有一種功能,就會(huì )帶來(lái)可觀(guān)的市場(chǎng)需求。所以機器人行業(yè)在未來(lái)的智能時(shí)代里將是非常主流的行業(yè),會(huì )有許多商業(yè)發(fā)展的可能性。
4 結束語(yǔ)
我國非常重視機器人/ 人形機器人的發(fā)展,舉辦生態(tài)大會(huì )可以促進(jìn)元部件/ 硬件、軟件和集成的參與者交流。期望在未來(lái)幾年里,通過(guò)“政產(chǎn)學(xué)研用”五個(gè)方面的結合,把機器人/ 人形機器人這個(gè)巨大的產(chǎn)業(yè)機會(huì )/市場(chǎng)做得非常好。
(本文來(lái)源于《EEPW》2024.6)
評論