从“会聊天”到“会做事”
2026年开年以来,AI圈出现热词“物理AI”。黄仁勋在年初CES展会上称“下一波AI浪潮将是在物理世界中运行的AI”,孙宇晨也表示“虚拟AI红利已尽,物理AI才是未来三年最大的机会”。在产业端,Figure AI以连续五天的机器人分拣直播引发关注,国内智元机器人宣布第10000台通用具身机器人下线。大佬发言和具身智能的变化,让行业聚焦从虚拟智能到实体执行的转变,但很多人疑惑“物理AI”是技术拐点还是概念换血。从字面看,物理AI是AI与物理世界深度融合的技术;深入内核,虚拟AI负责“思考与沟通”,物理AI要“感知并行动”,能让机器在真实物理世界感知、理解和执行复杂操作。中国计算机学会执行委员王翔在第三届中国国际供应链博览会上解释,“物理AI意味着AI系统具备在真实世界中‘感知—推理—行动—反馈’的闭环能力”。简单说,以前的AI“会聊天”,现在的物理AI“会做事”,当AI从ChatGPT对话框进入现实世界的工厂、仓库和家庭,就是物理AI要解决的问题。
这一差异在两家明星机器人公司动态中体现明显。美国的Figure AI从5月14日开始连续5天直播,3台Figure 03人形机器人在产线分拣快递包裹,检测条形码、抓取包裹、调整方向并将条码朝下放到传送带上。直播中,一台机器人连续工作超33小时,处理4万多个包裹,创始人布雷特·阿德科克称机器人采用最新的Helix 02模型,以“完全自主模式”运作。该直播表明物理AI越过“实验室演示”临界点,是有力的技术宣言。
中国的智元机器人也进行了类似直播,将智元精灵G2放到南昌龙旗科技产业园平板产线MMIT与人类一起工作。实测数据显示,机器人8小时连续作业零重大异常,整体作业成功率超99.5%;单道工序18 - 20秒,每小时完成310件产品,一台机器人可承担双工序工作量。此外,智元机器人3月官宣全球首个通用具身智能机器人1万台下线交付,从2025年12月到2026年3月,仅三个多月就从5000台跨越到10000台。智元还计划2027年营收达100亿,对于成立不到两年的公司,实现万台级别量产交付并定下百亿营收目标,在硬科技领域堪称现象级。
这两家公司的数据和场景证明,物理AI具备在真实环境中自主完成复杂任务的能力。智元率先迈过万台交付门槛,将量产能力与在手订单绑定,意味着物理AI从“技术验证”转向“商业兑现”,竞争进入“可用性”与“经济性”阶段。
物理AI爆发的技术推手
物理AI今年突然爆发,除商业化需求外,背后的技术突破是主要原因。
首先,大语言模型(LLM)赋予机器人“理解能力”。传统机器人依赖确定性代码和规则编程,环境变化就需重写代码,鲁棒性差,难以商业化。谷歌2023年8月推出Google PaLM - E与RT - 2等具身多模态大模型,使机器人能通过自然语言指令分解并执行复杂任务,LLM实现从“对话理解”到“物理执行”的跨越。黄仁勋在CES 2026演讲中指出,物理AI是底层控制权交接,控制权从人类编写的确定性代码转移到具有泛化能力、理解物理规律的神经网络,机器人拥有“理解指令并自我规划动作”的能力。
其次,世界模型解决“在物理世界中行动”的问题,其核心是让AI理解物理世界运转规律。英伟达去年CES发布的物理AI世界基础模型平台Cosmos是标志性事件,该模型能从文字或图像生成符合物理规律的动作数据,开发者可用其加速物理AI开发。Cosmos基于超2000万小时真实数据训练,降低模拟仿真与模型训练难度,AI系统可在虚拟环境演练后迁移到真实世界。
最后,Vision - Language - Action模型让机器人实现“看到即做到”的闭环。DeepMind去年9月发布Gemini Robotics 1.5,英伟达推出Isaac GR00T N1.6,北京人形机器人创新中心开源具身小脑大模型XR - 1。至此,物理AI具备落地的基础支撑技术能力,LLM让机器“听懂”,世界模型让机器“预判”,VLA打通“看懂”到“做对”的最后一公里,使机器人具备在开放环境自主执行任务的基础能力。不过,灵巧操作仍有瓶颈,物理AI要进入家庭还需跨越“精细化操作”的坎。
从技术愿景到交付能力
具身智能行业接下来的竞争围绕哪些核心维度展开?从自动驾驶发展来看,数据竞争不可避免,具身智能也一样,谁拥有高质量训练数据谁就有话语权。
英伟达用Cosmos奠定世界模型壁垒,其基于超2000万小时真实数据的训练模式难以复制;智元完成1万台机器人量产部署,拥有真实的、反馈驱动的数据采集能力,被视为数据护城河。物理AI竞争所需数据需合成数据与真实数据协同,单纯依赖真实数据有规模和硬件损耗问题,过度依赖合成数据有模拟到现实的迁移鸿沟,北京人形机器人创新中心的“跨数据源学习”方案可降低训练成本、提升效率。未来,谁能打通“合成数据训练 - 真实数据微调 - 实际场景反馈”闭环,谁就能占据竞争制高点。
将物理AI与虚拟AI高效融合是关键。物理AI与虚拟AI并非对立,完整的物理AI系统分三层:底层感知层、中层认知决策层、上层行动执行层。虚拟AI负责中间层,物理AI要打通从感知到执行的链条。英伟达的“芯片 + 模型 + 工具”全栈方案体现了这一思路,未来谁能做好软硬件深度融合,就能建立技术护城河。
物理AI的商业化进程中,资本评判标准从“技术愿景”变为“交付能力”。2025年中国具身智能领域融资总额735亿元、投融资事件744起,2026年以来追加超370亿元,累计突破1100亿元,但资本流向发生结构性转移。2026年5月,天机智能获10亿元B轮融资,核心是Q1在手订单突破10000台,客户覆盖45家机器人企业;中科第五纪获数亿元A轮融资,拿下海外数亿元订单;维他动力、鹿明机器人融资中产业投资人入局,将产线产能与机器人交付能力绑定。而美国人形机器人初创公司Cartwheel Robotics有技术愿景但无订单支撑,于2026年3月倒闭。这表明资本只为真实的量产交付能力付费。
结语
物理AI爆火看似突然,实则水到渠成。有人认为“物理AI”是资本市场概念包装,本质是具身智能和机器人技术的自然演进,但不可否认其兴起标志着AI产业从“虚拟智能”走向“实体执行”,是不可逆转的历史进程。在最新竞争中,Figure AI直播展示实力,智元机器人以量产交付建立壁垒,英伟达构建平台生态。未来,哪家公司会成为物理AI领域的OpenAI?哪个应用场景会迎来“ChatGPT时刻”?