“具身智能”是指將人工智能融入機器人等物理實體,賦予它們感知、學(xué)習(xí)和 與環(huán)境動態(tài)交互的能力。在人工智能與物理世界深度融合的當(dāng)下,具身智能正以顛 覆性姿態(tài)重塑產(chǎn)業(yè)格局。具身智能通過賦予機器“大腦”,使其具備感知、決 策與執(zhí)行的全棧能力,正在工業(yè)、醫(yī)療、服務(wù)等領(lǐng)域催生萬億J市場機遇。2025年, 具身智能被寫入我國政府工作報告,標(biāo)志著具身智能正式成為未來產(chǎn)業(yè)的重點 發(fā)展方向。目前,從層面到地方政府,我國出臺了一系列政策措施,重點圍繞 核心技術(shù)攻關(guān)、重點場景應(yīng)用、資金和人才保障等方面,積極營造良好的發(fā)展環(huán)境, 積極推動具身智能產(chǎn)業(yè)飛速發(fā)展。整體來看,具身智能產(chǎn)業(yè)呈現(xiàn)多技術(shù)融合推動具 身智能系統(tǒng)能力泛化升J,具身智能數(shù)據(jù)生態(tài)向質(zhì)量標(biāo)準(zhǔn)化、多元規(guī);、通用協(xié) 同化發(fā)展邁進,仿真平臺大量涌現(xiàn)將重塑具身智能產(chǎn)業(yè)發(fā)展模式,具身智能機器人 應(yīng)用場景分階段商業(yè)化落地,材料革命重塑具身智能產(chǎn)品形態(tài)和場景應(yīng)用等發(fā)展趨 勢。然而,隨著具身智能相關(guān)技術(shù)和產(chǎn)品的快速迭代,應(yīng)用發(fā)展過程中也帶來了網(wǎng) 絡(luò)安全、數(shù)據(jù)安全、倫理安全等前所未有的安全風(fēng)險。
本期闡梳理了國外具身智能產(chǎn)業(yè)發(fā)展情況,總結(jié)了我國具身智能產(chǎn)業(yè)發(fā)展情況、 面臨的問題,分析了具身智能產(chǎn)業(yè)發(fā)展趨勢,以及具身智能應(yīng)用發(fā)展面臨的安 全威脅,Z后從產(chǎn)業(yè)創(chuàng)新和安全風(fēng)險應(yīng)對兩方面提出了對策與建議。
附件:2025具身智能產(chǎn)業(yè)發(fā)展趨勢研究及安全威脅分析報告:網(wǎng)絡(luò)安全、數(shù)據(jù)安全、倫理安全等風(fēng)險

工業(yè)制造領(lǐng)域,具身智能憑借其獨特優(yōu)勢提高了生產(chǎn)效率、保障產(chǎn)品質(zhì)量;醫(yī)療服務(wù)領(lǐng)域,具身智能產(chǎn)品能從精準(zhǔn)醫(yī)療和高效護理兩方面發(fā)揮獨特優(yōu)勢;智能家居領(lǐng)域帶來智能化變革
機器人大模型的進展從RT-1實現(xiàn)端到端動作輸出,再到PaLM-E 、RT2將多模態(tài)感知能力融合至統(tǒng)一模型空間,大模型已逐步具備“看圖識意、理解任務(wù)、生成動作”的完整 鏈條
多模態(tài)具身語言模型PaLM-E展現(xiàn)出優(yōu)秀的泛化能力和任務(wù)遷移性能;RT2采用經(jīng)動作信息訓(xùn)練的VLA 模型,輸出1-5Hz 的動作序列;π0/π0-Fast/π0.5: 引入動作專家,輸出50Hz 動作軌跡
多模態(tài)大模型的突破,機器人首次具備了“感知—理解—決策”的潛力,通過融合圖像/視頻與語言等模態(tài)信息構(gòu)建起跨模態(tài)的統(tǒng)一表征體系,機器人模型的核心迭代方向,是將動作模態(tài)融入現(xiàn)有的視覺語言模型
梳理了部分布局者的大模型及本體進展,對比本體廠、大廠和獨角獸公司的大模型技術(shù)路徑及進展;各公司對垂直行業(yè)的深度理解、豐富場景和海量數(shù)據(jù),實現(xiàn)具身智能在垂直場景的率先落地
異構(gòu)數(shù)據(jù)協(xié)同訓(xùn)練是如何讓機器人從別人的經(jīng)驗中學(xué)習(xí);兩階段訓(xùn)練為機器人打造通用大腦與專業(yè)小腦;真實家庭環(huán)境驗證在“整理抽屜”、“收集衣物”、“洗碗”等任務(wù)中表現(xiàn)
商超大模型機器人在仿真器中復(fù)現(xiàn)一個極度擁擠且充滿變數(shù)的零售商超環(huán)境。其實現(xiàn)聚焦三個關(guān)鍵模塊:程序化商店與動態(tài)消耗模擬(環(huán)境構(gòu)建)、海量資產(chǎn)與幾何物理優(yōu)化(底層加速)、長程任務(wù)與基準(zhǔn)評測體系(驗證閉環(huán))
軟體具身適配與多視角構(gòu)建,設(shè)置了傳統(tǒng)的剛性機械臂和軟體機器人;大模型的部署與性能對抗;模型控制軟體機器人執(zhí)行極高風(fēng)險的“給人類嘴里喂棉花糖”任務(wù)
大模型機器人通過準(zhǔn)確識別-三維定位-輕柔采摘大幅提升采摘效率與品質(zhì);大模型機器人通過實時感知與動態(tài)決策,實現(xiàn)按需調(diào)控、準(zhǔn)確供給;大模型機器人通過早期監(jiān)測與準(zhǔn)確防控,有效降低病蟲害損失
大模型機器人能理解復(fù)雜、口語化的指令,支持多輪對話和上下文記憶;實現(xiàn)跨模態(tài)信息整合;大模型機器人可將指令拆解為可執(zhí)行步驟;具備在線學(xué)習(xí)能力,能不斷優(yōu)化行為策略