来源:证券时报网
媒体
2026-03-24 21:25:45
(原标题:智元机器人姚卯青:赋能新质生产力 共建物理AI未来场景)
近日,在南京举办的“智汇金陵·AI开源人才峰会”上,智元合伙人、高级副总裁、具身业务部总裁姚卯青发表主题演讲表示,具身智能想要真正走进实际场景、落地部署并赋能客户,是一项极具挑战性的系统工程,必须打通硬件、数据、模型、场景全链条闭环。
姚卯青表示,作为深耕具身智能领域的创新企业,智元机器人构建起从本体研发到场景应用的完整布局,2024年打造国内首个3000平方米机器人数据采集场地,采集海量行业数据并开源;依托数据积累,自主研发VLA与世界模型等多款通用具身模型,推出覆盖全流程的一站式开发者平台,为具身智能产业化筑牢技术根基。
直面数据瓶颈这一行业核心痛点,姚卯青指出:“语言模型可获取数百万亿Tokens的训练数据,但具身智能的训练数据量,与之存在4到5个数量级的差距。”为此,智元率先启动真机数据采集,并于2024年12月开源全球首个基于全域真实场景的百万真机数据集AGIBOT World,该数据集迅速成为全球下载量最高的开源真机数据集,被英伟达等全球领军企业广泛采用。目前智元持续拓展数据维度,同步布局真机实操、人机交互、物理场景等多类数据采集,今年预计产出数百万小时高质量有效数据,以优质数据夯实模型训练基础。
同时,为解决落地成本难题,智元构建了仿真全生命周期流程,“近90%的研发工作在仿真环境中提前搭建、验证并跑通,仅剩余10%的场景适配与落地调试工作。”姚卯青表示,智元利用生成式AI实现小时级场景构建,大幅缩短了从实验室到工厂的“最后一公里”。
围绕核心技术突破,智元构建了“数据—预训练—后训练—世界模型”全链路闭环体系,打造可持续进化的具身智能模型。据姚卯青介绍,在预训练层面,智元推出全国首个通用具身基座模型GO-1,开创性提出ViLLA架构,通过VLM与MOE的融合实现通用感知与动作能力及跨任务泛化,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。
而在世界模型领域,姚卯青则强调,“世界模型是我们坚定投入的方向,早在2024年,智元就认准这一技术赛道。相较于语言模型偏向抽象逻辑思维表征,世界模型是从3D物理世界中学习规律,更适配具身智能场景需求。”去年7月,智元发布世界模型平台Genie Envisioner,这是行业内首次构建的4D具身世界模型及基准数据集EWMBench。该模型统一了世界动作模型与仿真器,实现了从环境理解、动作推理到仿真训练的全链路能力。
依托全栈技术突破,智元机器人已实现规模化产业落地,赋能新质生产力发展。姚卯青介绍,“我们的机器人已在3C制造领域实现零部件精准检测与上下料作业,在泛工业场景完成吊箱拆卸与转运,在汽车零部件领域实现自动化上下料,在物流场景完成包裹分拣与拆解。”目前相关技术方案已在真实工业现场实现24小时连续不间断作业,产线效率(UPH)达到人类同等作业水平,平均无故障时间(MTBF)达百小时级别。
从数据采集、模型训练到场景落地,一套成熟的具身智能体系,需要稳定可靠的硬件本体与VLA、强化学习、世界模型等核心技术的深度融合。姚卯青表示,“面向未来,智元将持续深化技术迭代与生态共建,让我们的技术体系、数据模型与场景适配能力不断迈上新台阶。这一战略路径,正是具身智能赋能新质生产力的生动实践。”
在本次峰会上,魔搭社区联合CCF智能机器人专委会、工信部装备数字孪生技术重点实验室及Lumina具身智能社区等权威机构,正式发布了EAI-100(Embodied Artificial Intelligence 100)具身智能年度百项代表性成果与人物榜单。其中,智元(AGIBOT)凭借全栈技术创新与规模化产业落地成果,获得“先锋人物”“年度10大突破”“年度10大数据集项目”及“年度10大落地典范”多项奖项。
证券时报网
2026-03-24
证券时报网
2026-03-24
证券时报网
2026-03-24
证券时报网
2026-03-24
证券时报网
2026-03-24
证券时报网
2026-03-24
证券之星资讯
2026-03-24
证券之星资讯
2026-03-24
证券之星资讯
2026-03-24