跳到主要内容

具身科普

如果你还没准备直接进入教程，可以先从这页开始。

这页不讲太多公式，也不要求你先会 ROS、强化学习或者机器人学。目标只有一个：用最短时间帮你建立对具身智能的整体认识。

什么是具身智能

具身智能可以简单理解成：让智能体不只是“会想”，而且“能感知、能决策、能动作”。

和纯软件 AI 不同，具身智能最终要落到真实世界任务里，例如：

机械臂抓取、装配、搬运
人形机器人完成家庭或工业任务
轮式机器人进行导航、巡检、配送
多模态智能体根据图像和语言指令完成动作

它本质上是一条完整链路：

感知 -> 理解 -> 决策 -> 动作 -> 控制执行

为什么最近这么火

主要有三件事叠在一起：

大模型和多模态模型的发展，让机器人“理解指令和场景”的能力明显增强
仿真平台、数据采集和算力条件成熟，让训练和迭代更快
企业开始真正把机器人部署到工厂、仓储、服务和家庭场景里

所以现在行业不只是需要“研究者”，也需要大量能把模型、软件、仿真和硬件打通的人。

这个方向都在做什么

如果把岗位拆开看，通常会落在这几类：

算法方向：VLA、模仿学习、强化学习、多模态建模
工程方向：ROS2、部署、仿真、系统联调
数据方向：遥操作采集、数据清洗、数据集构建
硬件方向：传感器、控制、驱动、嵌入式与实机调试

这也是为什么同样想做具身智能，不同背景的人学习路径会完全不一样。

先看哪部分最合适

如果你想先判断自己适合哪条线，直接看学习地图
如果你已经准备系统学习，直接进基础教程
如果你更想通过代码和案例建立感受，直接看项目实践
如果你想看后续更新和更轻量的内容，去博客

推荐阅读顺序

对大多数新用户，我建议这样走：

先看这页，建立行业全貌
再看学习地图，确定自己的方向
然后进入基础教程或项目实践

这样会比一上来就闷头看教程更省时间。

什么是具身智能
为什么最近这么火
这个方向都在做什么
先看哪部分最合适
推荐阅读顺序