工联网消息(IItime) 近日,中国信息通信研究院(以下简称“中国信通院”)与北京人形机器人创新中心有限公司于2024年世界机器人大会共同发布《具身智能产业发展报告(2024年)》。会上,中国信通院副总工程师许志远对报告内容进行解读。
报告亮点
一、具身智能:“具身”是前提,“智能”是核心。
具身智能指通过物理实体与环境交互,能进行环境感知、信息认知、自主决策和采取行动,并能够从经验反馈中实现智能增长和行动自适应的智能系统。
具身智能强调智能不仅体现在处理信息和解决问题的能力上,还体现在对其周围环境的感知、理解和操作能力上。
二、具身智能需要同时具备“本体+环境+智能”三要素。
1.要有具身本体,通常是机器人等物理实体;
2.要能与环境交互,能主动感知环境,能通过行动改变环境,还能在与环境的交互中不断学习和适应;
3.要有智能的提升,不仅通过算法和计算实现智能,还通过本体与物理世界的交互来展现和发展智能。
三、具身智能技术体系可分为“感知—决策—行动—反馈”四个模块
具身智能技术体系可分为“感知—决策—行动—反馈”四个模块,四个模块形成一个闭环,在与环境的不断交互中,实现对环境的重构映射、自主决策和自适应行动,并从经验反馈中不断学习进化。
四、具身智能的三个基本表现与四个能力增长点,将在多个领域释放出巨大的应用潜力
相比于传统基于AI视觉及特定场景预训练的机器人,具身智能具体表现在:一是不再依赖预定义的复杂逻辑来管理场景;二是能形成学习进化机制,持续获取交互反馈来实现环境自适应;三是能通过身体与环境交互产生新的交互数据,并用于实现智能增长。目前的最新进展仅是基本具备三个表现,尚未出现功能完善的商业化产品。
但可以预见的是,随着技术的不断突破,具身智能将使得各种物理实体显现出四个能力增长点,包括对环境动态变化的自适应能力、多任务行动的泛化能力、交互方式的拟人化表现和更高的任务执行效率。这些能力增长点有望带来更高的应用价值和广阔的市场空间。
五、具身智能仍面临技术能力不足,数据短缺,以及工程实现复杂等一系列挑战
算法层面,“大模型+机器人”的研究范式,仍需要学习人类的智能和经验;尚未实现感知和行动紧密联系的认知映射。
数据层面,真实数据获取难度大,而仿真数据面临现实差距。如何实现低成本、规模化地获取具身智能数据,是亟待解决的关键瓶颈。
工程实现层面,需要依赖完善的软件生态,进行软硬件有效适配,并且要兼顾芯片算力供给和经济性、通信总线的交换效率、运动功耗等各项指标。