91久久精品无码毛片国产高清

中證網
返回首頁

人形機器人打開“具身智能”藍圖

張漫子 經濟參考報

  從搬(ban)運重物到(dao)(dao)端茶倒水,從進(jin)廠打工到(dao)(dao)做飯疊衣……當大模型(xing)為機(ji)器(qi)人(ren)(ren)注入“靈魂”,人(ren)(ren)形機(ji)器(qi)人(ren)(ren)“進(jin)化”加速。業內人(ren)(ren)士指(zhi)出,人(ren)(ren)形機(ji)器(qi)人(ren)(ren)工業場景的落地(di)最快(kuai)今(jin)年或(huo)明年就能在部分試點(dian)實(shi)現,“入戶”則將在10年左右。

  變化——邁入“人形時代”

  近期,國產人(ren)(ren)形機(ji)(ji)(ji)(ji)器(qi)人(ren)(ren)領域動作頻頻:全球首(shou)例(li)純電(dian)驅全尺寸人(ren)(ren)形機(ji)(ji)(ji)(ji)器(qi)人(ren)(ren)“天工(gong)”首(shou)次在北京(jing)人(ren)(ren)形機(ji)(ji)(ji)(ji)器(qi)人(ren)(ren)創新中心實(shi)現(xian)“擬(ni)人(ren)(ren)奔(ben)跑”、瞄準老(lao)年(nian)人(ren)(ren)陪護市場的(de)人(ren)(ren)形機(ji)(ji)(ji)(ji)器(qi)人(ren)(ren)Unitree G1問世、工(gong)業(ye)版人(ren)(ren)形機(ji)(ji)(ji)(ji)器(qi)人(ren)(ren)Walker S進入蔚(yu)來總裝車間“實(shi)訓”當起“見習廠工(gong)”……

  不止中國,站上風口(kou)的(de)人形機(ji)器人,正在席卷全球一(yi)二(er)級市(shi)(shi)場(chang)。從創業公司(si)到(dao)科技巨頭(tou),從軟(ruan)件(jian)平臺到(dao)硬件(jian)開發,都在競相入場(chang)。當英偉達(da)、特斯(si)拉、微(wei)軟(ruan)紛紛以實際行動表示“看漲”后,高盛重新調整了對(dui)2035年(nian)人形機(ji)器人全球市(shi)(shi)場(chang)規模的(de)預期:從60億美元上調至380億美元。

  “一條千(qian)億元規模的(de)賽道,三個因素缺一不可:市場需求的(de)驅動、產業(ye)鏈(lian)條的(de)完(wan)備(bei)、核心(xin)技術的(de)突破。”優必(bi)選副總裁、研究(jiu)院(yuan)執行(xing)院(yuan)長焦繼超(chao)說,“機器人+大模型”落地提(ti)速的(de)今天,技術、資(zi)本、市場實現具身(shen)智能的(de)熱情(qing),掀(xian)起廣闊的(de)想象(xiang)空間。

  老齡化社(she)(she)會(hui)、少子化社(she)(she)會(hui)的(de)(de)(de)疊加,以及(ji)勞動力的(de)(de)(de)相對短(duan)缺,激發了社(she)(she)會(hui)對人(ren)(ren)(ren)形(xing)機器人(ren)(ren)(ren)的(de)(de)(de)切(qie)實(shi)需求。“制造(zao)業(ye)(如(ru)汽車(che)組(zu)裝(zhuang)、零部件(jian)排(pai)序)及(ji)特(te)殊作業(ye)(如(ru)高空作業(ye)、危險(xian)任(ren)務)方面,人(ren)(ren)(ren)形(xing)機器人(ren)(ren)(ren)能完成高風險(xian)、重復(fu)性的(de)(de)(de)臟(zang)活(huo)、苦活(huo)、累活(huo),降低相關(guan)崗位的(de)(de)(de)傷病率、死(si)亡(wang)率,提升職業(ye)滿(man)意度,因此市(shi)場對人(ren)(ren)(ren)形(xing)機器人(ren)(ren)(ren)的(de)(de)(de)到來充滿(man)期(qi)待。”北京大學計算機學院博(bo)士生導師、北大-銀河(he)通用具身(shen)智能聯合實(shi)驗室主(zhu)任(ren)王鶴說。

  記者來到北(bei)京人(ren)形機器人(ren)創(chuang)新中心(xin),迎面遇見一位身材頎長的機器人(ren)正在爬樓梯。這個名為“天工”的人(ren)形機器人(ren)不(bu)僅擁有聰明的腦、靈巧的手,絲(si)滑(hua)的動作間還透著些許“柔美(mei)”,就連外形都與人(ren)類(lei)貼(tie)近:身高1.63米、體重43公(gong)斤。當工程師向“她”發(fa)出(chu)指令,只見“天工”上半(ban)身略向前傾,手臂配合(he)腿部移動加大擺動,竟(jing)邁開小步(bu)跑了起(qi)來。

  深(shen)耕機(ji)器人(ren)20余年的(de)北(bei)京人(ren)形(xing)機(ji)器人(ren)創新中心總(zong)經理熊友軍相信,通用機(ji)器人(ren)的(de)未來形(xing)態一定是(shi)“人(ren)形(xing)”。

  過去傳統的僅從事單一操作(zuo)的專用機器人(ren),如(ru)焊接機器人(ren)、打磨機器人(ren),本質(zhi)上是(shi)一個自動化設備,僅需(xu)執行(xing)人(ren)提前寫(xie)好的固定(ding)程序,因(yin)此形(xing)態上只(zhi)需(xu)要(yao)一條腿或一只(zhi)臂(bei)。

  “而大(da)模型為機(ji)器(qi)人(ren)(ren)(ren)注(zhu)入‘靈魂’后,機(ji)器(qi)人(ren)(ren)(ren)獲得了前所未(wei)有的(de)(de)感知、理解(jie)、推(tui)理、決策能力,能完成(cheng)(cheng)復雜環境的(de)(de)多元任務。一方(fang)面(mian),人(ren)(ren)(ren)類社會的(de)(de)基礎設(she)施、場景構建、工具設(she)計,均是(shi)基于人(ren)(ren)(ren)類的(de)(de)物理特性進行開發,‘人(ren)(ren)(ren)形’可降低適配成(cheng)(cheng)本、快(kuai)速適應環境;另(ling)一方(fang)面(mian),未(wei)來通(tong)用機(ji)器(qi)人(ren)(ren)(ren)的(de)(de)終極目標是(shi)走入人(ren)(ren)(ren)類生活、服(fu)務人(ren)(ren)(ren)類,‘人(ren)(ren)(ren)形’是(shi)與(yu)人(ren)(ren)(ren)交(jiao)互最自然、體驗最優的(de)(de)形態。”熊友軍說。

  進化——實現“知行合一”

  這屆“人形機(ji)器人”妙在何處(chu)?

  相較于過(guo)去一(yi)只機械臂(bei),已“實(shi)訓(xun)”下車(che)(che)間的國產人形(xing)機器(qi)人Walker S用絲滑行(xing)動給出答案:“她(ta)”的一(yi)雙敏捷手(shou)對準車(che)(che)頭精準貼上(shang)車(che)(che)標,一(yi)雙靈巧腳帶動軀干協調地自(zi)動走位(wei)到每個(ge)座椅進(jin)行(xing)安全帶的拉伸檢測,一(yi)雙“慧眼”還能對準車(che)(che)門、車(che)(che)身表面進(jin)行(xing)缺陷檢測。

  “這(zhe)屆(jie)人(ren)形機器(qi)人(ren)的飛(fei)(fei)躍性突破是(shi)‘知行合一’。表現為‘聰明腦’指揮‘敏(min)捷手’‘靈巧腳(jiao)’,使機器(qi)人(ren)行動(dong)起來更加自主、靈活,且能在學習中(zhong)不斷(duan)進化。”科大訊飛(fei)(fei)機器(qi)人(ren)首(shou)席科學家季超說。

  何來“聰(cong)明腦”“敏捷手”“靈巧腳”?

  “一方面(mian),大模型的迭代使‘大腦(nao)’更加聰明;另一方面(mian),人(ren)形機器(qi)人(ren)軟硬件能(neng)力(li)的提升,使運動更加靈活(huo)。兩股力(li)量牽引(yin)人(ren)形機器(qi)人(ren)的進化(hua)。”季超說。

  看上(shang)去,大(da)模型有(you)了“身體”,機器人也有(you)了“大(da)腦”。往里看,其實(shi)是(shi)大(da)模型的感知推理能(neng)力,融入(ru)了機器人的具身能(neng)力。

  這(zhe)些類(lei)人的能力又是如何(he)實現的?

  “源自三(san)個部分:感知、規劃(hua)、執(zhi)行。”王(wang)鶴說,從技術實現(xian)角度(du),如(ru)果拿人來(lai)類比,不僅需要(yao)人類智慧的(de)核(he)心(xin)大腦(nao),也(ye)關系到負責運動控制的(de)小腦(nao)。

  人形機器(qi)(qi)人的“大腦(nao)”負責感知、理解、規(gui)(gui)劃(hua)(hua)(hua)。“當我們對機器(qi)(qi)人說‘我渴了’,機器(qi)(qi)人首先會理解并拆解意圖,然(ran)后分(fen)步(bu)驟進行規(gui)(gui)劃(hua)(hua)(hua)設計:比如(ru),第一(yi)步(bu)尋找水(shui)在哪(na)里,第二步(bu)思考如(ru)何打(da)開冰箱門(men)、從冰箱中取出水(shui)、關(guan)上冰箱門(men),第三步(bu)遞(di)送到我們面(mian)前(qian)。這每一(yi)步(bu),包括理解語義、任務規(gui)(gui)劃(hua)(hua)(hua),都在‘大腦(nao)’中進行。”王鶴舉例說。

  人形機器人“小(xiao)腦(nao)”的(de)使命則是(shi)運動控制、任務執行。王鶴(he)進一步解釋,“例如(ru),如(ru)何找到冰(bing)箱(xiang)位置、避開路障走(zou)過去(qu),用多大的(de)力去(qu)伸手(shou)(shou)拉門(men)、冰(bing)箱(xiang)門(men)開到多大,以及(ji)行走(zou)的(de)每(mei)一步如(ru)何調動四肢與軀(qu)干(gan)、實現手(shou)(shou)眼腳協調運動,‘小(xiao)腦(nao)’實現的(de)任務是(shi)當(dang)前研發的(de)難點。”

  “技術路線上,今(jin)天的人形機器(qi)人已經越(yue)來越(yue)接近人類(lei)思考、決策、執行(xing)的過(guo)程(cheng)。”熊友軍(jun)說,過(guo)去的認知是通過(guo)語(yu)音交互(hu)、視(shi)覺(jue)(jue)識(shi)別(bie),以自然語(yu)言(yan)理解的方(fang)式(shi)或傳(chuan)統的人工智能(neng)方(fang)式(shi)實現(xian),現(xian)在則(ze)使用VLA(視(shi)覺(jue)(jue)語(yu)言(yan)動作)這樣的多模(mo)態大(da)模(mo)型(xing)來完成“大(da)腦”功能(neng)。過(guo)去的運動控制是通過(guo)模(mo)型(xing)優(you)化的方(fang)式(shi),而現(xian)在人形機器(qi)人的跑、跳則(ze)更(geng)多是基(ji)于強化學(xue)習(xi)、模(mo)仿學(xue)習(xi)來實現(xian)“小腦”與“軀干”的功能(neng)。

  大(da)模型的(de)(de)迭代為機器人帶(dai)來的(de)(de)革命性變化在(zai)于,它不僅應用于“大(da)腦(nao)”的(de)(de)理(li)解、推理(li)、規(gui)劃之中,也(ye)將融入到“小腦(nao)”“軀干”參與的(de)(de)感知與執行過(guo)程。

  人形機器人擁有更(geng)加強大的泛化能(neng)力后,將更(geng)好地與(yu)物理世界交(jiao)(jiao)互(hu)(hu),進一步降低(di)部署成本、應用門(men)檻,這也是(shi)具身(shen)智(zhi)能(neng)前進的方(fang)向。“具身(shen)智(zhi)能(neng)強調智(zhi)能(neng)體(ti)與(yu)物理世界的交(jiao)(jiao)互(hu)(hu)與(yu)反饋,服務于現實(shi)場景,解(jie)決人類的實(shi)際訴求。”焦繼超說。

  演化——“入戶”十年可期

  人(ren)(ren)形機(ji)器人(ren)(ren)以“洪荒之力”模(mo)仿并復(fu)刻人(ren)(ren)類(lei)智能,但它終(zhong)究不是人(ren)(ren)類(lei)。

  莫拉維克(ke)悖論指(zhi)出,人(ren)(ren)類(lei)獨有(you)的(de)高(gao)階智(zhi)慧對機器(qi)(qi)而言只需要(yao)極(ji)少的(de)運(yun)算,如推(tui)理,而人(ren)(ren)類(lei)無意識的(de)技(ji)能(neng)與直覺卻需要(yao)機器(qi)(qi)耗費極(ji)大的(de)運(yun)算能(neng)力,如接住拋物。

  “眼下,人形(xing)機器(qi)(qi)人的能力瓶(ping)頸并非在(zai)于‘大腦’的感知、理(li)解、判斷,而恰(qia)恰(qia)是缺(que)乏類似人類‘小(xiao)腦’的泛化執行能力。”王鶴說,這一瓶(ping)頸導致(zhi)的問題就是人形(xing)機器(qi)(qi)人“干活”不夠快、不夠敏捷(jie)。

  這一瓶(ping)頸的(de)(de)根源是高質(zhi)量數據(ju)的(de)(de)匱乏。“機器人‘大腦(nao)’所(suo)需(xu)數據(ju)可從互聯網的(de)(de)文本(ben)、圖(tu)像中獲得,而‘小腦(nao)’所(suo)需(xu)的(de)(de)數據(ju)少之又(you)少。有限的(de)(de)來源之一是國(guo)外(wai)部分企業采取的(de)(de)人工遙控機器訓練的(de)(de)方式,采集到的(de)(de)數據(ju)既難(nan)、又(you)貴、且慢。”王(wang)鶴說。

  高精度(du)模擬(ni)真實(shi)世(shi)界(jie)(jie)的(de)物(wu)理(li)場景、于(yu)仿真環境(jing)里合成的(de)數據不失為一種有效的(de)解決方案。比如,合成靈巧手模擬(ni)真實(shi)世(shi)界(jie)(jie)抓取物(wu)體進行(xing)訓練采集到的(de)數據,然后(hou)在真實(shi)環境(jing)里測試、泛化,能破解機器人“小腦”所需的(de)數據“投喂”問題。

  還有專(zhuan)家指(zhi)出,實時(shi)性、推理速度也(ye)是當前具(ju)身智能(neng)面(mian)臨(lin)的(de)(de)另一(yi)瓶頸。目前,基(ji)于大模型的(de)(de)機(ji)器人控制在(zai)線決(jue)策至少需50毫(hao)秒,一(yi)般(ban)延遲為1至5秒,無法滿(man)足工業場(chang)景3至10毫(hao)秒的(de)(de)需要(yao)。

  “人形機器(qi)人是一(yi)塊(kuai)難啃(ken)的硬(ying)骨(gu)頭,它的突破一(yi)定需要(yao)時(shi)間的積累(lei)和技術的沉淀。大(da)規模量產、商業化也都是挑戰(zhan)。”多位受訪者表示,盡管(guan)人形機器(qi)人的成長(chang)速度肉(rou)眼可見(jian),但距離產業爆(bao)發(fa)的“iPhone時(shi)刻”還(huan)有距離。

  “可以確定的是(shi),人(ren)形(xing)機器人(ren)率(lv)先在(zai)工業(ye)場景落地,接下來是(shi)應(ying)用于(yu)商業(ye)場景,最后是(shi)進入(ru)(ru)千(qian)家(jia)萬戶。其中,工業(ye)場景的落地最快今年(nian)或明年(nian)就(jiu)能(neng)在(zai)部分試點實(shi)現,人(ren)形(xing)機器人(ren)‘入(ru)(ru)戶’在(zai)10年(nian)左(zuo)右實(shi)現。”熊(xiong)友軍(jun)說。

  焦繼超(chao)給出一組(zu)數據:目(mu)前,中國(guo)是(shi)全(quan)球申(shen)請人(ren)形機(ji)器(qi)(qi)人(ren)技術專利最多的國(guo)家,共計6618件。“這(zhe)將為我國(guo)人(ren)形機(ji)器(qi)(qi)人(ren)產(chan)業穩步向好發(fa)展夯(hang)實基礎。”

  “什么時候我們(men)能(neng)做到‘類(lei)腦模型’,把所(suo)有模態數據一股腦放(fang)入數據集(ji)中,還能(neng)響(xiang)應(ying)足夠敏捷,聽得懂語義、解析得了意圖(tu),也就真正(zheng)實現了具身智(zhi)能(neng),這也是我們(men)將著(zhu)力解決的(de)問題(ti)。”王鶴說。

中證網聲明:凡本網注明“來源:中國證券報·中證網”的所有作品,版權均屬于中國證券報、中證網。中國證券報·中證網與作品作者聯合聲明,任何組織未經中國證券報、中證網以及作者書面授權不得轉載、摘編或利用其它方式使用上述作品。