188体育app官网_188体育投注

编者寄语

数据驱动的人工智能在封闭场景的特定任务中展现出惊人性能,但环境适应较弱、泛化能力受限、交互效率低下等瓶颈日益凸显。具身智能(Embodied Intelligence)通过重构智能生成范式——以物理实体为基底,在动态环境交互中耦合感知、决策与行动等能力,为突破上述困局开辟了新路径。当前技术革新与产业需求的双重驱动下加速了该领域的崛起。在技术侧,高精度多模态传感器、仿生驱动机构、高保真物理仿真平台的突破,使机器人在复杂物理交互中的实时状态感知与运动控制成为可能;而自监督学习、强化学习与仿真-现实迁移技术的结合,更催生出"以交互代标注"的全新训练范式。在应用侧,从家庭服务机器人需应对的非结构化家居环境,到工业4.0要求的柔性产线实时调整,从灾难救援现场的动态地形适应,到医疗康复中的人机协同操作,传统预设程序已难以满足开放场景需求,而具身智能正成为实现自主进化型机器的关键。

本专题系统梳理具身智能的核心突破点,既涵盖具身智能基础理论与认知模型、空间感知建模、协同学习、仿真学习等理论框架,也整合开源仿真工具链及跨场景应用案例,旨在为研究者提供从基础理论到工程实践的"具身化"设计范式参考,推动机器人从机械式的任务执行者进化为能与环境共演的智能体。

编委主任:苏金树 CCF会士 军事科学院教授

本期主编:樊   鑫  CCF智能机器人专委会委员 大连理工大学教授

具身智能发展综述

论文给出具身AI百科全书式研究综述,涵盖模拟器评估与研究进展两大维度:模拟器评估方面,基于自主设计的七大核心特性(如物理交互保真度、多模态感知支持等),深度解析9款主流具身AI模拟器的功能定位与局限性包括模拟器测评;研究进展方面,聚焦视觉探索(Visual Exploration)、视觉导航(Visual Navigation)、具身问答(Embodied QA)三大核心任务,梳理技术前沿、评估指标与基准数据集。最后,基于评估结果提出“任务-模拟器”匹配策略,并指明具身AI未来发展的关键方向。

格式:
文章
具身智能的机理与认知基础

具身智能近年来受到大量关注,被誉为人工智能的下一个浪潮。具身智能的典型特色是具身性、情境化、交互性和主动性,通过身体在物理环境中互动来实现的智能。本报告将对具身智能的具身机理进行探讨,包括身体、智能与环境的相互关系,分析具身智能是脑控全身还是身脑互控; 并对类动物行为、类人类智能、感知-行为快速适应性反馈、及具身认知等不同层面的智能体现进行介绍。

格式:
视频
具身多模态感知与物理交互建模

本次报告围绕在线三维重建,在线场景理解,以及在线三维交互,汇报我们近年来的系列工作,包括:快速相机运动下的实时三维重建,机器人自主与协同式场景扫描与重建,机器人主动式场景理解,以及基于三维几何表征学习的机器人灵巧抓取等。

格式:
视频
具身智能感知-想象-执行学习框架

围绕具身智能PIE方案,P(Perception)介绍机器人全感知与交互感知,I(Imagination)介绍物理世界概念驱动的仿真推理框架,E(Execution)介绍通用元操作技能设想与工作。基于上述三个模块,介绍具身PIE大模型探索与初步成果。最后介绍具身认知智能工作,如何验证脑神经行为与身体行为稳定隐射关系。

格式:
视频
具身智能体记忆和持续学习

作为一种将人工智能与机器人技术相结合的新型智能系统,具身智能体的记忆和持续学习是非常关键的问题。在这个报告中,我将介绍我们在这两个方向的一些初步探索,并就未来可以进一步深入研究的问题给出一些粗浅的想法。

格式:
视频
具身协同与交互学习

近年来,多机器人协同技术受到越来越多的关注,在仓储物流、工业制造、协同探索等实际应用场景中应用广泛。本报告将针对具身协同感知,从任务分解、任务分配和任务调度等方面介绍多智能体的具身协同。进一步,将探讨如何利用智能体身体与环境的交互来提升其学习性能,使得智能体能通过在环境中的探索,不断学习并更新自身知识。

格式:
视频
合成数据驱动的具身智能

报告将讨论通过具身多模态大模型系统融合视觉语言等模态可以直接对高度泛化通用的物理任务输出动作的解决方案。介绍由本体和数据构成基石层、大脑和小脑构成能力层的具身多模态大模型系统方案。对于本体和数据,我们将对人形机器人的形态进行探讨,提供硬件的发展思路和基于合成大数据的泛化训练数据获取途径。对于能力层,我们完全通过合成数据和Sim2Real实现了多个泛化的移动和操作技能,包括二指和灵巧抓取、铰接类物体操作、柔性物体操作、端到端视觉语言导航大模型等等,这些构成了小脑。而对于大脑,我们将展示GPT-4V为代表的非具身多模态大模型进行视觉感知、任务规划和调用中层的三维视觉技能,实现从家用电器泛化操作到开放指令物体摆放的能力。最后,报告将展望通用机器人的未来,讨论其中的机会和挑战。

格式:
视频
人机交互评测基准集

Meta的Habitat平台是一个专为机器人训练设计的高仿真AI模拟环境,支持机器人在多样化、逼真的室内场景中学习导航、物体操作及人机协作等复杂任务,例如通过虚拟化身与机器人共同完成家务或社交互动。其最新版本Habitat 3.0结合了大规模合成数据集和物理引擎,显著提升了环境交互的真实性,并加速了从模拟训练到现实应用的迁移效率,是推动具身智能发展的关键技术工具。

格式:
工具

本期编委成员