来源:汽车之家
2025-03-18 11:47:58
(原标题:能与用户沟通/理解用户意图 理想发布下一代自动驾驶架构MindVLA)
汽车之家 资讯 日前,理想汽车发布下一代自动驾驶架构MindVLA。MindVLA是一个能与用户沟通、理解用户意图的智能体,可以理解为是一名能听懂用户说话的专职机器人司机。MindVLA是一种视觉-语言-行为大模型,是机器人大模型的新范式,它将空间智能、语言智能和行为智能统一在一个模型里。
MindVLA将为用户带来全新的产品形态和产品体验,有MindVLA赋能的汽车是听得懂、看得见、找得到的专职司机。“听得懂”是用户可以通过语音指令改变车辆的路线和行为,例如用户在陌生园区寻找超市,只需要通过理想同学对车辆说:“带我去找超市”,车辆将在没有导航信息的情况下,自主漫游找到目的地;车辆行驶过程中,用户还可以跟理想同学说:“开太快了”“应该走左边这条路”等,MindVLA能够理解并执行这些指令。
“看得见”是指MindVLA具备强大的通识能力,不仅能够认识星巴克、肯德基等不同的商店招牌,当用户在陌生地点找不到车辆时,可以拍一张附近环境的照片发送给车辆,拥有MindVLA赋能的车辆能够搜寻照片中的位置,并自动找到用户。
“找得到”意味着车辆可以自主地在地库、园区和公共道路上漫游,其中典型应用场景是用户在商场地库找不到车位时,可以跟车辆说:“去找个车位停好”,车辆就会自主寻找车位,即便遇到死胡同,车辆也会自如地倒车,重新寻找合适的车位停下,整个过程不依赖地图或导航信息,完全依赖MindVLA的空间理解和逻辑推理能力。
MindVLA利用Diffusion将Action Token解码成优化的轨迹,并通过自车行为生成和他车轨迹预测的联合建模,提升了在复杂交通环境中的通行能力。面对部分长尾场景,理想建立起人类偏好数据集,并且创新性地应用RLHF(基于人类反馈的强化学习)微调模型的采样过程,最终使MindVLA能够学习和对齐人类驾驶行为,显著提升自动驾驶系统的安全下限。(编译/汽车之家 颜欢)
汽车之家
2025-03-18
汽车之家
2025-03-18
快科技
2025-03-18
快科技
2025-03-18
汽车之家
2025-03-18
快科技
2025-03-18
证券之星资讯
2025-03-18
证券之星资讯
2025-03-18
证券之星资讯
2025-03-18
询价信息已提交