智元机器人姚卯青：赋能新质生产力共建物理AI未来场景

来源：证券时报网

媒体

2026-03-24 21:25:45

（原标题：智元机器人姚卯青：赋能新质生产力共建物理AI未来场景）

近日，在南京举办的“智汇金陵·AI开源人才峰会”上，智元合伙人、高级副总裁、具身业务部总裁姚卯青发表主题演讲表示，具身智能想要真正走进实际场景、落地部署并赋能客户，是一项极具挑战性的系统工程，必须打通硬件、数据、模型、场景全链条闭环。

姚卯青表示，作为深耕具身智能领域的创新企业，智元机器人构建起从本体研发到场景应用的完整布局，2024年打造国内首个3000平方米机器人数据采集场地，采集海量行业数据并开源；依托数据积累，自主研发VLA与世界模型等多款通用具身模型，推出覆盖全流程的一站式开发者平台，为具身智能产业化筑牢技术根基。

直面数据瓶颈这一行业核心痛点，姚卯青指出：“语言模型可获取数百万亿Tokens的训练数据，但具身智能的训练数据量，与之存在4到5个数量级的差距。”为此，智元率先启动真机数据采集，并于2024年12月开源全球首个基于全域真实场景的百万真机数据集AGIBOT World，该数据集迅速成为全球下载量最高的开源真机数据集，被英伟达等全球领军企业广泛采用。目前智元持续拓展数据维度，同步布局真机实操、人机交互、物理场景等多类数据采集，今年预计产出数百万小时高质量有效数据，以优质数据夯实模型训练基础。

同时，为解决落地成本难题，智元构建了仿真全生命周期流程，“近90%的研发工作在仿真环境中提前搭建、验证并跑通，仅剩余10%的场景适配与落地调试工作。”姚卯青表示，智元利用生成式AI实现小时级场景构建，大幅缩短了从实验室到工厂的“最后一公里”。

围绕核心技术突破，智元构建了“数据—预训练—后训练—世界模型”全链路闭环体系，打造可持续进化的具身智能模型。据姚卯青介绍，在预训练层面，智元推出全国首个通用具身基座模型GO-1，开创性提出ViLLA架构，通过VLM与MOE的融合实现通用感知与动作能力及跨任务泛化，让机器人既能从人类视角学习动作规律，又能掌握物理世界交互逻辑。

而在世界模型领域，姚卯青则强调，“世界模型是我们坚定投入的方向，早在2024年，智元就认准这一技术赛道。相较于语言模型偏向抽象逻辑思维表征，世界模型是从3D物理世界中学习规律，更适配具身智能场景需求。”去年7月，智元发布世界模型平台Genie Envisioner，这是行业内首次构建的4D具身世界模型及基准数据集EWMBench。该模型统一了世界动作模型与仿真器，实现了从环境理解、动作推理到仿真训练的全链路能力。

依托全栈技术突破，智元机器人已实现规模化产业落地，赋能新质生产力发展。姚卯青介绍，“我们的机器人已在3C制造领域实现零部件精准检测与上下料作业，在泛工业场景完成吊箱拆卸与转运，在汽车零部件领域实现自动化上下料，在物流场景完成包裹分拣与拆解。”目前相关技术方案已在真实工业现场实现24小时连续不间断作业，产线效率（UPH）达到人类同等作业水平，平均无故障时间（MTBF）达百小时级别。

从数据采集、模型训练到场景落地，一套成熟的具身智能体系，需要稳定可靠的硬件本体与VLA、强化学习、世界模型等核心技术的深度融合。姚卯青表示，“面向未来，智元将持续深化技术迭代与生态共建，让我们的技术体系、数据模型与场景适配能力不断迈上新台阶。这一战略路径，正是具身智能赋能新质生产力的生动实践。”

在本次峰会上，魔搭社区联合CCF智能机器人专委会、工信部装备数字孪生技术重点实验室及Lumina具身智能社区等权威机构，正式发布了EAI-100（Embodied Artificial Intelligence 100）具身智能年度百项代表性成果与人物榜单。其中，智元（AGIBOT）凭借全栈技术创新与规模化产业落地成果，获得“先锋人物”“年度10大突破”“年度10大数据集项目”及“年度10大落地典范”多项奖项。