在科技飛速發(fā)展的當(dāng)下,人形機(jī)器人宛如一顆璀璨新星,迅速崛起,成為科技領(lǐng)域炙手可熱的焦點(diǎn)。無(wú)論是在被譽(yù)為科技界“春晚”的國(guó)際消費(fèi)電子展CES上,還是在有著“中國(guó)科技第一展”之稱的中國(guó)國(guó)際高新技術(shù)成果交易會(huì)上,人形機(jī)器人都占據(jù)C位,大放異彩。
各大媒體也對(duì)人形機(jī)器人青睞有加,頻繁報(bào)道。從特斯拉Optimus在工廠里靈活作業(yè),到宇樹科技的Unitree G1以親民價(jià)格震撼市場(chǎng),每一次人形機(jī)器人的新突破、新進(jìn)展,都能成為輿論熱點(diǎn),在網(wǎng)絡(luò)上掀起討論熱潮,吸引著全球目光。
2025年1月30日,特斯拉在業(yè)績(jī)會(huì)上更新了Optimus機(jī)器人量產(chǎn)指引,2025年目標(biāo)生產(chǎn)1萬(wàn)臺(tái)機(jī)器人,產(chǎn)能第一步擴(kuò)至每月1000臺(tái),到2026年每月產(chǎn)能達(dá)到10000臺(tái),2027年每月產(chǎn)能達(dá)到10萬(wàn)臺(tái)。
圖1 特斯拉的Optimus[1]
2025年1月28日,宇樹科技的Unitree G1在央視春晚的舞臺(tái)上進(jìn)行了扭秧歌表演,能靈活地跳舞、轉(zhuǎn)手絹,展示了其靈活的操控性能。緊接著,2025年2月6日,宇樹機(jī)器人與英偉達(dá)協(xié)作,G1人形機(jī)器人在英偉達(dá)上海年會(huì)上展示了超凡的表演能力,能模仿體育界巨星如C羅、詹姆斯和科比的經(jīng)典動(dòng)作,還能隨著節(jié)奏扭動(dòng)身體,展示了其卓越的舞蹈天賦。
圖2 宇樹科技的Unitree G1[2]
早期探索:夢(mèng)想的萌芽
人類對(duì)人形機(jī)器人的幻想,最早可追溯至15世紀(jì)的達(dá)·芬奇時(shí)代。這位偉大的藝術(shù)家、科學(xué)家在其手稿中繪制了一個(gè)人形機(jī)器人——“機(jī)器武士”,以木頭、金屬和皮革為外殼,由齒輪驅(qū)動(dòng),依靠風(fēng)和水力運(yùn)轉(zhuǎn),能完成坐、站立、揮舞胳膊等簡(jiǎn)單動(dòng)作。雖然受限于當(dāng)時(shí)的科技水平,“機(jī)器武士”未能具備真正的智能,但它無(wú)疑是人類探索人形機(jī)器人領(lǐng)域的先驅(qū)之作,為后來(lái)者種下了夢(mèng)想的種子。[3]
時(shí)光流轉(zhuǎn)到了20世紀(jì)上半葉,美國(guó)開啟了現(xiàn)代意義上的人形機(jī)器人研制。1954年,美國(guó)人喬治·德沃爾制造出世界上第一臺(tái)可編程的機(jī)械手,并注冊(cè)專利,這一創(chuàng)舉拉開了現(xiàn)代機(jī)器人發(fā)展的序幕。隨后,被譽(yù)為“機(jī)器人之父”的約瑟夫·恩格爾伯格創(chuàng)建了世界上第一家機(jī)器人公司Unimation,幾年后,該公司的第一臺(tái)機(jī)器人產(chǎn)品Unimate問(wèn)世。1968年,美國(guó)斯坦福國(guó)際研究所成功研制出移動(dòng)式機(jī)器人Shakey,它是世界上第一臺(tái)帶有人工智能的機(jī)器人,能夠自主進(jìn)行感知、環(huán)境建模、行為規(guī)劃等任務(wù),讓人們看到了機(jī)器人從機(jī)械執(zhí)行向智能決策邁進(jìn)的曙光。
關(guān)鍵突破:技術(shù)的飛躍
20世紀(jì)60年代起,人形機(jī)器人的研發(fā)迎來(lái)了關(guān)鍵突破。1967年,日本早稻田大學(xué)研制出WABOT-1,它高約2米,重160公斤,配備肢體控制系統(tǒng)、視覺系統(tǒng)和語(yǔ)音交互系統(tǒng),擁有仿人雙手和雙腿,全身共26個(gè)關(guān)節(jié),胸部裝有兩個(gè)攝像頭,手部裝有觸覺傳感器。盡管WABOT-1的行動(dòng)能力僅相當(dāng)于一歲多的嬰兒,行走一步需要45秒,步伐只有10公分左右,但它的誕生意義非凡,代表人類已初步實(shí)現(xiàn)全尺寸人形機(jī)器人雙足行走,其主要?jiǎng)?chuàng)造者加藤一郎也因此被譽(yù)為“世界仿人機(jī)器人之父”。
圖3 日本早稻田大學(xué)研制的WABOT-1[4]
在WABOT-1的基礎(chǔ)上,科學(xué)家們不斷探索創(chuàng)新。2000年,本田公司推出人形機(jī)器人ASIMO,身高130厘米,體重48公斤,全身57個(gè)關(guān)節(jié),最大速度是9km/h。ASIMO不僅能實(shí)現(xiàn)小跑、單足跳、上下樓梯和踢足球等復(fù)雜運(yùn)動(dòng),還能實(shí)時(shí)預(yù)測(cè)下一個(gè)動(dòng)作并提前改變自身重心,具備與人握手、揮手、隨音樂起舞等交互能力。經(jīng)過(guò)多次迭代,ASIMO的功能愈發(fā)強(qiáng)大,可利用傳感器避障、預(yù)先設(shè)定動(dòng)作、依據(jù)人類聲音和手勢(shì)等指令采取相應(yīng)動(dòng)作,還具備基本的記憶與辨識(shí)能力,成為當(dāng)時(shí)人形機(jī)器人技術(shù)的集大成者,讓人們對(duì)人形機(jī)器人的未來(lái)充滿期待。
2009年,波士頓動(dòng)力的Atlas機(jī)器人問(wèn)世,原型機(jī)于2013年7月向公眾公開。Atlas采用液壓驅(qū)動(dòng)電液混合模式,融合了光學(xué)雷達(dá)、激光測(cè)距儀、TOF深度傳感器等先進(jìn)設(shè)備的技術(shù)能力。經(jīng)過(guò)幾次優(yōu)化,它通過(guò)RGB攝像頭和TOF深度傳感器獲取環(huán)境信息,利用模型預(yù)測(cè)控制器技術(shù)(MPC)跟蹤動(dòng)作、調(diào)整發(fā)力和姿勢(shì)動(dòng)作等,在28個(gè)液壓驅(qū)動(dòng)器的推動(dòng)下,可在復(fù)雜障礙環(huán)境內(nèi)做出跳躍、翻滾、小跑、三級(jí)跳等一系列高難度動(dòng)作,其卓越的平衡能力和靈活的運(yùn)動(dòng)控制令人驚嘆,將人形機(jī)器人的運(yùn)動(dòng)性能提升到了一個(gè)新的高度。
圖4 波士頓動(dòng)力Atlas[5]
近年來(lái),特斯拉的Optimus橫空出世,引發(fā)全球關(guān)注。2022年10月1日,Optimus原型機(jī)正式亮相,展示了在汽車工廠搬運(yùn)箱、澆水植物、移動(dòng)金屬棒等操作。它身高171厘米,重56.6公斤,可拿取約20千克重的物品,行走速度為約時(shí)速8公里。Optimus的大腦采用特斯拉的超級(jí)計(jì)算機(jī)系統(tǒng)Dojo,還與特斯拉汽車共享神經(jīng)網(wǎng)絡(luò)(NN),并安裝了相同的完全無(wú)人駕駛系統(tǒng)(FSD)。FSD包含多個(gè)傳感器、計(jì)算機(jī)、人工智能技術(shù)和算法,以及導(dǎo)航和地圖數(shù)據(jù)等,幫助汽車和機(jī)器人在各類環(huán)境中實(shí)現(xiàn)感知、決策和行動(dòng)。特斯拉基于汽車的技術(shù)、品牌和市場(chǎng)積累,將通用能力尤其是在頂層數(shù)據(jù)和技術(shù)開發(fā)上的突破向機(jī)器人遷移,為Optimus的產(chǎn)業(yè)化落地奠定了堅(jiān)實(shí)基礎(chǔ),也讓人形機(jī)器人邁向了產(chǎn)業(yè)化的新階段。
人形機(jī)器人的技術(shù)架構(gòu)可以從不同維度進(jìn)行分類,本文按照功能模塊對(duì)人形機(jī)器人的技術(shù)架構(gòu)進(jìn)行專利分類解析。那么目前人形機(jī)器人領(lǐng)域的關(guān)鍵技術(shù)有哪些,具體解決方法是什么?讓我們從專利中找到答案。
圖5 人形機(jī)器人技術(shù)架構(gòu)圖
人形機(jī)器人技術(shù)架構(gòu)包括感知系統(tǒng)、控制系統(tǒng)、動(dòng)力系統(tǒng)和機(jī)械結(jié)構(gòu)系統(tǒng),下面分別詳細(xì)介紹:
感知系統(tǒng)包括視覺系統(tǒng)、聽覺系統(tǒng)、力覺與觸覺系統(tǒng)、以及其他感知模塊。
感知系統(tǒng)相關(guān)專利布局多為兩種及以上感知系統(tǒng)耦合,可顯著提升其環(huán)境感知能力、決策準(zhǔn)確性和交互自然性。如復(fù)旦大學(xué)申請(qǐng)的專利CN113910217B,通過(guò)麥克風(fēng)陣列采集語(yǔ)音信號(hào)并記錄時(shí)間;然后利用人聲識(shí)別方法識(shí)別,統(tǒng)計(jì)采集到人聲的麥克風(fēng)數(shù)量;從視頻中獲取人臉圖像幀,利用人臉辨識(shí)方法辨識(shí)并統(tǒng)計(jì)人臉數(shù)量;再結(jié)合唇動(dòng)檢測(cè)算法實(shí)現(xiàn)唇動(dòng)識(shí)別。這樣通過(guò)視覺、聽覺兩方面的融合處理,確定頭部的轉(zhuǎn)向角度,提高了交互自然性。
在視覺、聽覺和嗅覺系統(tǒng)的耦合方面,2024年北京大學(xué)與北京龍軟科技股份有限公司聯(lián)合申請(qǐng)的專利CN118230135B,通過(guò)集成部署成對(duì)的視覺、聽覺和嗅覺采集設(shè)備,實(shí)時(shí)記錄設(shè)備周圍環(huán)境或環(huán)境內(nèi)同一空間對(duì)象的位置、形態(tài)、運(yùn)動(dòng)狀態(tài)、聲音和氣味等多維度的連續(xù)時(shí)空信息對(duì)。系統(tǒng)將同一時(shí)刻時(shí)空信息對(duì)以成對(duì)的形式存儲(chǔ)和同步融合處理,以實(shí)現(xiàn)相互印證并形成具有景深和屬性標(biāo)識(shí)的三維處理結(jié)果或視頻流,達(dá)到識(shí)別和理解場(chǎng)景中的時(shí)空關(guān)系和事件的效果。
控制系統(tǒng)主要負(fù)責(zé)規(guī)劃和控制機(jī)器人的運(yùn)動(dòng)軌跡、姿態(tài),根據(jù)任務(wù)需求生成關(guān)節(jié)角度、速度等控制指令,使機(jī)器人能夠完成行走、抓取等動(dòng)作;根據(jù)感知系統(tǒng)獲取的信息和預(yù)設(shè)的目標(biāo),進(jìn)行任務(wù)分解、路徑規(guī)劃、動(dòng)作選擇等高層決策,確定機(jī)器人的行為策略;利用傳感器反饋的信息,實(shí)時(shí)調(diào)整控制參數(shù),確保機(jī)器人的運(yùn)動(dòng)和操作達(dá)到預(yù)期效果,提高系統(tǒng)的穩(wěn)定性和準(zhǔn)確性。
如深圳市優(yōu)必選科技股份有限公司申請(qǐng)的專利CN113031579B,根據(jù)雙足機(jī)器人當(dāng)前所處的步態(tài)周期確定該雙足機(jī)器人的期望力矩控制量,由此,更準(zhǔn)確地確定期望力矩控制量,從而使得根據(jù)該期望力矩控制量控制的雙足機(jī)器人行走更穩(wěn)定。
又如2023年波士頓動(dòng)力公司申請(qǐng)的專利US12194629B2,基于機(jī)器人的導(dǎo)航目標(biāo)和運(yùn)動(dòng)狀態(tài)信息確定機(jī)器人的軌跡目標(biāo),進(jìn)而確定機(jī)器人的重定向軌跡;基于重定向軌跡,確定機(jī)器人的質(zhì)心軌跡和運(yùn)動(dòng)學(xué)軌跡,進(jìn)而確定機(jī)器人的關(guān)節(jié)向量,實(shí)現(xiàn)人形機(jī)器人在困難的地形、不可預(yù)見的障礙以及外部條件意外變化的環(huán)境中完成導(dǎo)航動(dòng)作。
動(dòng)力系統(tǒng)包括電機(jī)與驅(qū)動(dòng)器、電池與電源管理兩方面。
電機(jī)與驅(qū)動(dòng)器為機(jī)器人的關(guān)節(jié)提供動(dòng)力,常見的有伺服電機(jī)、步進(jìn)電機(jī)等,驅(qū)動(dòng)器用于控制電機(jī)的轉(zhuǎn)速、扭矩和位置。
在該技術(shù)方向上,代表專利如2023年杭州宇樹科技有限公司申請(qǐng)的專利CN220687938U,提出了一種復(fù)合減速結(jié)構(gòu)的關(guān)節(jié)動(dòng)力機(jī)構(gòu),采用多級(jí)減速結(jié)構(gòu),其在一級(jí)減速結(jié)構(gòu)中采用雙面齒圈作嚙合傳動(dòng),通過(guò)內(nèi)外雙側(cè)均設(shè)齒面的雙面齒圈在內(nèi)齒圈上作偏心運(yùn)動(dòng),來(lái)帶動(dòng)外齒圈輸出,利用較小的結(jié)構(gòu)空間即可獲得較高的減速比;并且由于該級(jí)減速結(jié)構(gòu)在相互嚙合傳動(dòng)過(guò)程中,始終是齒面接觸,齒的接觸面積大,接觸數(shù)量多,因而其抗過(guò)載能力強(qiáng),不容易因載荷沖擊而損壞或失效。
電池與電源管理為機(jī)器人提供電力支持,高性能的電池需要具備高能量密度、長(zhǎng)續(xù)航能力,電源管理系統(tǒng)則負(fù)責(zé)對(duì)電池進(jìn)行充放電管理、能量分配等。
如2024年深圳市優(yōu)必選科技股份有限公司申請(qǐng)的專利CN221575152U和CN117748946A,針對(duì)人形機(jī)器人在運(yùn)動(dòng)過(guò)程中因舵機(jī)電壓波動(dòng)導(dǎo)致電路紋波大,影響系統(tǒng)穩(wěn)定性,甚至導(dǎo)致主芯片停止工作的問(wèn)題,當(dāng)電源信號(hào)發(fā)生波動(dòng)時(shí),通過(guò)儲(chǔ)能電路進(jìn)行放電至降壓模塊降壓,以輸出滿足外部電路所需的供電電壓信號(hào)。同時(shí)通過(guò)防反電路使得當(dāng)電源信號(hào)波動(dòng)時(shí)防止儲(chǔ)能電路倒灌,不僅電路結(jié)構(gòu)簡(jiǎn)單,而且成本較低。
機(jī)械結(jié)構(gòu)系統(tǒng)包括決定了機(jī)器人的運(yùn)動(dòng)靈活性和自由度的各種關(guān)節(jié),如旋轉(zhuǎn)關(guān)節(jié)、直線關(guān)節(jié)等,不同的關(guān)節(jié)設(shè)計(jì)適用于不同的運(yùn)動(dòng)需求。
在該技術(shù)方向上的代表專利如特斯拉公司在2023年申請(qǐng)的WO2024073135A1,通過(guò)使用單個(gè)線性執(zhí)行器以最小的運(yùn)動(dòng)實(shí)現(xiàn)大角度的旋轉(zhuǎn),從而提高機(jī)器人系統(tǒng)的效率和可靠性,從而優(yōu)化機(jī)器人應(yīng)用的關(guān)節(jié)設(shè)計(jì)。
又如2024年杭州宇樹科技有限公司申請(qǐng)的專利CN221938342U,針對(duì)現(xiàn)有技術(shù)無(wú)法滿足人形機(jī)器人實(shí)現(xiàn)各種姿態(tài)、動(dòng)作的要求,擬人效果不好,不利于人形機(jī)器人推廣使用的問(wèn)題,通過(guò)設(shè)置大腿體、小腿體和腳部支撐件以及相應(yīng)的髖關(guān)節(jié)驅(qū)動(dòng)單元、膝關(guān)節(jié)驅(qū)動(dòng)單元、腳踝驅(qū)動(dòng)單元,并且對(duì)結(jié)構(gòu)進(jìn)行緊湊設(shè)計(jì),使得人形機(jī)器人可以做出各種擬人化的腿部以及腳部動(dòng)作。
技術(shù)瓶頸:前行路上的阻礙
盡管人形機(jī)器人取得了顯著進(jìn)展,但在技術(shù)層面仍面臨諸多瓶頸。能源續(xù)航問(wèn)題是亟待解決的一大難題。目前,人形機(jī)器人大多依賴電池供電,然而現(xiàn)有電池技術(shù)能量密度較低,難以滿足機(jī)器人長(zhǎng)時(shí)間、高強(qiáng)度工作的需求。以目前市場(chǎng)上的主流人形機(jī)器人為例,一次充滿電后,其續(xù)航時(shí)間往往僅能維持1-2小時(shí),這極大地限制了機(jī)器人的工作范圍和效率。在實(shí)際應(yīng)用中,頻繁充電不僅耗費(fèi)時(shí)間,還可能影響任務(wù)的連續(xù)性和穩(wěn)定性。
此外,人工智能技術(shù)的不完善也制約了人形機(jī)器人的發(fā)展。人形機(jī)器人需要具備強(qiáng)大的人工智能算法,以實(shí)現(xiàn)對(duì)復(fù)雜環(huán)境的感知、理解和決策。目前的人工智能技術(shù)在處理一些復(fù)雜場(chǎng)景和突發(fā)情況時(shí),仍表現(xiàn)出明顯的不足。當(dāng)遇到未知的環(huán)境變化或意外情況時(shí),機(jī)器人可能無(wú)法及時(shí)做出準(zhǔn)確的判斷和反應(yīng),導(dǎo)致任務(wù)失敗或出現(xiàn)安全問(wèn)題。在復(fù)雜的室內(nèi)環(huán)境中,機(jī)器人可能會(huì)因?yàn)闊o(wú)法準(zhǔn)確識(shí)別和避開障礙物而發(fā)生碰撞,影響其正常運(yùn)行。
技術(shù)突破:可期的變革
展望未來(lái),在能源續(xù)航方面,新型電池技術(shù)的研發(fā)或?qū)⑷〉弥卮筮M(jìn)展。固態(tài)電池作為一種極具潛力的新型電池,正逐漸成為研究熱點(diǎn)。與傳統(tǒng)鋰電池相比,固態(tài)電池采用固態(tài)電解質(zhì)替代液態(tài)電解質(zhì),具有更高的能量密度,能夠?yàn)槿诵螜C(jī)器人提供更持久的續(xù)航能力。固態(tài)電池的能量密度可比傳統(tǒng)鋰電池提高2-3倍,這意味著人形機(jī)器人一次充電后,可運(yùn)行的時(shí)間將大幅延長(zhǎng),工作效率將得到顯著提升。此外,固態(tài)電池還具有更高的安全性,能夠更好地適應(yīng)復(fù)雜的工作環(huán)境,減少因電池問(wèn)題引發(fā)的安全隱患,為人形機(jī)器人的廣泛應(yīng)用提供有力保障。
在人工智能技術(shù)方面,隨著深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等技術(shù)的不斷發(fā)展,人形機(jī)器人的智能水平將實(shí)現(xiàn)質(zhì)的飛躍。未來(lái),人形機(jī)器人有望具備更強(qiáng)大的認(rèn)知能力和情感理解能力,能夠更好地理解人類的意圖、情感和需求,實(shí)現(xiàn)更加自然、流暢的人機(jī)交互。通過(guò)與人類的互動(dòng)和學(xué)習(xí),人形機(jī)器人可以不斷積累知識(shí)和經(jīng)驗(yàn),提高自身的智能水平,成為人類真正的智能伙伴。
材料科學(xué)的進(jìn)步也將為人形機(jī)器人帶來(lái)新的變革。新型材料的研發(fā)將使機(jī)器人更加輕便、靈活且堅(jiān)固耐用。例如,碳纖維材料具有高強(qiáng)度、低密度的特點(diǎn),其強(qiáng)度是鋼鐵的數(shù)倍,但重量卻輕得多,將其應(yīng)用于人形機(jī)器人的結(jié)構(gòu)部件,可顯著降低機(jī)器人的自重,提高其能源利用效率和運(yùn)動(dòng)靈活性。同時(shí),智能材料的發(fā)展也將為人形機(jī)器人帶來(lái)更多的可能性。智能材料能夠根據(jù)外界環(huán)境的變化自動(dòng)調(diào)整自身的性能,如形狀、硬度等,使人形機(jī)器人能夠更好地適應(yīng)不同的工作場(chǎng)景和任務(wù)需求。
隨著技術(shù)的不斷突破,人形機(jī)器人在未來(lái)社會(huì)的應(yīng)用前景將更加廣闊,將深度融入人類生活的各個(gè)領(lǐng)域,成為推動(dòng)社會(huì)發(fā)展的重要力量。
特斯拉的人形機(jī)器人optimus圖片 - 搜索 圖片 ↑
春晚宇樹科技手絹 - 搜索 圖片 ↑
人形機(jī)器人:千年想象終成現(xiàn)實(shí) ↑
日本早稻田大學(xué)研制的WABOT-1圖片 - 搜索 ↑
波士頓動(dòng)力Atlas圖片 - 搜索 ↑
作者:品源知識(shí)產(chǎn)權(quán)管理咨詢有限公司 張?zhí)扉?/p>