《具身智能产业发展报告（2024年）》近日发布

工联网消息(IItime) 近日，中国信息通信研究院（以下简称“中国信通院”）与北京人形机器人创新中心有限公司于2024年世界机器人大会共同发布《具身智能产业发展报告（2024年）》。会上，中国信通院副总工程师许志远对报告内容进行解读。

报告亮点

一、具身智能：“具身”是前提，“智能”是核心。

具身智能指通过物理实体与环境交互，能进行环境感知、信息认知、自主决策和采取行动，并能够从经验反馈中实现智能增长和行动自适应的智能系统。

具身智能强调智能不仅体现在处理信息和解决问题的能力上，还体现在对其周围环境的感知、理解和操作能力上。

二、具身智能需要同时具备“本体+环境+智能”三要素。

1.要有具身本体，通常是机器人等物理实体；

2.要能与环境交互，能主动感知环境，能通过行动改变环境，还能在与环境的交互中不断学习和适应；

3.要有智能的提升，不仅通过算法和计算实现智能，还通过本体与物理世界的交互来展现和发展智能。

三、具身智能技术体系可分为“感知—决策—行动—反馈”四个模块

具身智能技术体系可分为“感知—决策—行动—反馈”四个模块，四个模块形成一个闭环，在与环境的不断交互中，实现对环境的重构映射、自主决策和自适应行动，并从经验反馈中不断学习进化。

四、具身智能的三个基本表现与四个能力增长点，将在多个领域释放出巨大的应用潜力

相比于传统基于AI视觉及特定场景预训练的机器人，具身智能具体表现在：一是不再依赖预定义的复杂逻辑来管理场景；二是能形成学习进化机制，持续获取交互反馈来实现环境自适应；三是能通过身体与环境交互产生新的交互数据，并用于实现智能增长。目前的最新进展仅是基本具备三个表现，尚未出现功能完善的商业化产品。

但可以预见的是，随着技术的不断突破，具身智能将使得各种物理实体显现出四个能力增长点，包括对环境动态变化的自适应能力、多任务行动的泛化能力、交互方式的拟人化表现和更高的任务执行效率。这些能力增长点有望带来更高的应用价值和广阔的市场空间。

五、具身智能仍面临技术能力不足，数据短缺，以及工程实现复杂等一系列挑战

算法层面，“大模型+机器人”的研究范式，仍需要学习人类的智能和经验；尚未实现感知和行动紧密联系的认知映射。

数据层面，真实数据获取难度大，而仿真数据面临现实差距。如何实现低成本、规模化地获取具身智能数据，是亟待解决的关键瓶颈。

工程实现层面，需要依赖完善的软件生态，进行软硬件有效适配，并且要兼顾芯片算力供给和经济性、通信总线的交换效率、运动功耗等各项指标。