官方网站-首页发布时间:2025-03-14 16:30:30
阅读量:473次
在2025年3月5日第十四届全国人民代表大会第三次会议上的政府工作报告中,特别提到了“具身智能”。

图片截自中华人民共和国中央人民政府网站 www.gov.cn
那么具身智能到底是什么呢?

图库版权图片,转载使用可能引发版权纠纷
回想我们看过的科幻电影,经典的机器人角色有很多——从冷酷强悍的杀手,到矫健的拳击运动员,从稳重冷静的维修工,到神烦碎嘴的礼仪官……不过,这些作品中的想象很美好,但(dàn)实(shí)现(xiàn)起(qǐ)来(lái)真(zhēn)的(de)很(hěn)难(nán)——甚(shén)至(zhì)光(guāng)是(shì)让(ràng)机(jī)器(qì)人(rén)像(xiàng)人那(nà)样(yàng)迈(mài)开(kāi)两条腿走路,都历尽坎坷。
反观我们人类的小宝宝,成长过程中也没有人给他们编什么程序,经过多次尝试和摔倒之后,他们自己就学会了爬和走,很快就能跑得飞快并躲开障碍。而“具身智能”技术,就参考了这个过程——这项技术能让机器人像人那样,用身体感知世界,在互动学习中成长。
具身智能是什么,
是怎么跟机(jī)器(qì)人(rén)结(jié)合(hé)的(de)?
具(jù)身(shēn)智(zhì)能(néng),英(yīng)文全称(chēng)是(shì)“Embodied Artificial Intelligence”,从(cóng)这(zhè)个(gè)全称(chēng)我(wǒ)们(men)可(kě)以(yǐ)看(kàn)出(chū),其(qí)实(shí)具(jù)身(shēn)智(zhì)能(néng)这(zhè)个(gè)词中(zhōng)的(de)“智(zhì)能(néng)”就是“ AI ”(人工智能)的意思。而说到 AI ,大家早都不陌生了,从 ChatGpt 到 DeepSeek ,都是 AI 的一种。它们就像没有身体的“大脑”,虽然能从外部接收数据并解决问题,但它们作为没有身体的软件系统,缺乏通过身体(tǐ)与(yǔ)环(huán)境(jìng)交(jiāo)互(hù)的(de)能(néng)力(lì)和反馈机制。

图库版权图片,转载使用可能引发版权纠纷
举个例子,下围棋的 AlphaGo ,就必须有一位工作人员在场上帮它落子,因为 AlphaGo 是个纯算法系统,尽管能在服务器上快速训练成千上万场棋局,甚至能够战胜世界冠军,但它自己甚至根本不具备在真实世界中拿起一枚棋子的能力。而具身智能机器人,则能通过摄像头、触觉及其他传感器等“感官”收集环境信息,并用肢体与环境互动,进而形成“感知-行动”的闭环。
了解了上面的信息,再解释具身智能相关的概念就比较容易理解了,所谓“具身智能”是指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。总结一下,具身智能就是“能够感知、推理并与物理世界互动的智能系统”。而具身智能机器人,可以视为具身智能系统的载体。
那么,“具身智能机器人”可以简单理解为“给 AI 套了一具身体”或“给机器人装上了一个 AI ”吗?这种认识也是不全面的。举个例子,现在有一些机器人产品,能够做一些简单的动作,也连上了 AI ,甚至可以跟人聊得有来有回,但它们仍然不能算是具身智能。
这是因为它缺少了至关重要的一环,也就是“具身智能”中的“具身性”(Embodiment)。而具身性的核心在于,智能必须通过物理身体与环境的实时交互和动态反馈来生成,而非依赖预设程序或离线数据,要靠深度融合人工智能与机器人两大前沿技术才能实现这个目标,简单“拼”在一起是不行的。
为什么我们需要具身智能机器人?
其实现在已经有很多机器人在帮助人类劳动了,但很多机器人工作的时候依赖预先编好的程序,我们经常能看到工厂生产线中的机械臂(也是机器人的一种),它们高效默契地运行,能有条不紊地进行搬运、焊接等工作。这类机械臂通常高度依赖编程行动,虽然可以分毫不差地运行,也集成了一些基本的传感器以便了解工作状态,但遇到突发情况却仍然“不懂”避让行人(在无需工人的生产线上通常也没有必要)。
这也是为什么很多工厂的机械臂操作区都要装上隔离网,标上警戒线。因为这些机械臂工作时“只认程序不认人”,虽然有大量安全相关的措施和规章制度保障,但如果有人疏忽(hū)大(dà)意(yì)踏(tà)入(rù)它(tā)们(men)的(de)工(gōng)作(zuò)范(fàn)围(wéi),仍(réng)可(kě)能(néng)发(fā)生(shēng)悲(bēi)剧(jù)——面(miàn)对(duì)严(yán)格(gé)按(àn)程(chéng)序(xù)从(cóng) A 点(diǎn)运(yùn)动(dòng)到(dào) B 点(diǎn)的(de)机(jī)械(xiè)臂(bì),挡(dǎng)在(zài)路上(shàng)的(de)人(rén)体(tǐ)实(shí)在(zài)太(tài)脆(cuì)弱(ruò)了(le)。
试(shì)想(xiǎng)一(yī)下(xià),你(nǐ)敢(gǎn)让(ràng)这(zhè)样(yàng)一(yī)个(gè)一(yī)个(gè)“只(zhǐ)认(rèn)程(chéng)序(xù)”的(de)机(jī)器(qì)人(rén),走(zǒu)进(jìn)你(nǐ)的(de)家(jiā)中(zhōng),帮(bāng)你(nǐ)打(dǎ)理(lǐ)家(jiā)务,照顾老(lǎo)人(rén)小(xiǎo)孩吗?当然,现在很多流水线(xiàn)上(shàng)用(yòng)的(de)工(gōng)业(yè)机(jī)器人也有了碰撞检测等功能,变得更加安全,但它们仍然是按预设程序执行,缺乏动态学习能力,更适合执行简单的重复任务。而一旦面临复杂的环境和任务,只靠预设程序是行不通的,因(yīn)为(wèi)在(zài)复(fù)杂(zá)环(huán)境(jìng)下(xià),很(hěn)难(nán)穷尽所有的规则。
这(zhè)里(lǐ)再举个例子,在汽车制造业中,诸如搬运物料、抛光、焊接、喷漆等加工工序,大部分可以用机器人轻松完成。但是到了发动机、底盘、电器等装配工序,大部分工作仍难以用机器人完成,因为这些工作更加复杂,更需要“随机应变”以及沟通合作,机器人还无法胜任,需要人工。
而具身智能,则更加灵活,具有适应环境解决复杂任务的潜力,要想让机器人实现更加广泛的应用并走(zǒu)进(jìn)千(qiān)家(jiā)万户,需要发展具身智能。
具身智能机器人,“活学活用”
由于具身智能和机器人的技术非常复杂,也有很多不同的技术路线,下面(miàn)仅(jǐn)以(yǐ)具身智能开源学习项目 LeRobot 为例,简单介绍一下具身智能机器人的基本特点。
假设我们的任务目标是让机械臂捡起黄色的小积木块,再放进盒子里。我们可以编(biān)程(chéng)序(xù)直(zhí)接“命令”机械臂严格按照规定路径和动作运行——很多生产线上的工业机器人正是如此,但只要积木换个地方,机械臂按之前的行动路径就会捡个空。我们也可以编程序让机械臂能识别出积木块,再执行“捡”的动作并放进盒子里,这样更加灵活,但仍需要事先编写相应的程序。
而 LeRobot 则是靠人操作主动臂,“手把手”地教从动臂完成一次捡起积木放进盒子的过程,从动臂运动的整个过程会被 2 个不同位置的摄像头全程监控并记录。改变几次积木位置,操纵机械臂重复数十到上百次捡起和放下的动作,就能获得足够的资料。

LeRobot 的一次训练过程 来自 Huggingface 官方教程
再通过算法“学习”这些资料,就能让这套系统“学会”捡积木——如果有积木块出现在机械臂面前,它就会自己拿起积木来放进盒子。

LeRobot 一次成功的自主拾取过程 来自 Huggingface 官方教程
上图中,研究人员并没有操作主臂,甚至积木的位置也改变了,但机械臂仍然能自主完成任务。
从上面这个简单的例子中,我们能了解具身智能的一些最基本的特点。首先,具身智能可以通过身体与环境的实时交互学习(多次捡起积木),不用事先编写大量规则穷尽所有可能。其次,具身智能能够在执行任务的过程中动态调整策略(积木换个地方也能捡到)。
当然,这只是个简单的例子,实际上具身智能机器人的技术路线有很多,除了像上边的例子中基于真实世界交互的,还有在虚拟环境中进行的仿真训练以及二者相结合的等等。此外,具身智能机器人还能实现远比捡起积木扔进盒子里复杂得多的功能。比如行走、适应地形,模拟人的动作等等,不久之后,相信各类具身智能机器人,就能在更多的领域发挥重要作用。
最后总结一下,具身智能和机器人技术的融合,将会让未来的机器人变得更加能干,甚至能理解和模拟简单的感情交互。而且,对具身智能和机器人的持续投入,更将带动从软件到硬件的整个产业链的发展。
策划制作
作者丨丁崝 科普作者
审核丨于乃功 北京工业大学机器人工程专业负责人,北京人工智(zhì)能(néng)研(yán)究(jiū)院(yuàn)机(jī)器(qì)人(rén)研(yán)究(jiū)中(zhōng)心(xīn)主任(rèn),博(bó)士(shì)生(shēng)导(dǎo)师(shī)
策(cè)划(huà)丨(gǔn)丁(dīng)崝(zhēng)
审(shěn)校(xiào)丨(gǔn)徐(xú)来(lái)、林(lín)林(lín)
本(běn)文封(fēng)面(miàn)图(tú)片(piàn)及(jí)文内(nèi)图(tú)片(piàn)来(lái)自(zì)版(bǎn)权(quán)图(tú)库(kù)
转(zhuǎn)载(zài)使(shǐ)用(yòng)可(kě)能(néng)引(yǐn)发(fā)版(bǎn)权(quán)纠(jiū)纷(fēn)