新浪科技讯 3月18日午间消息,理想汽车自动驾驶技术研发负责人贾鹏在NVIDIA GTC 2025发表主题演讲《VLA:迈向自动驾驶物理智能体的关键一步》,分享了理想汽车对于下一代自动驾驶技术MindVLA的最新思考和进展。
贾鹏表示:“MindVLA是机器人大模型,它成功整合了空间智能、语言智能和行为智能,一旦跑通物理世界和数字世界结合的范式后,将有望赋能更多行业。MindVLA将把汽车从单纯的运输工具转变为贴心的专职司机,它能听得懂、看得见、找得到。我们希望MindVLA能为汽车赋予类似人类的认知和适应能力,将其转变为能够思考的智能体。”
据介绍,基于端到端+VLM双系统架构的实践,及对前沿技术的洞察,理想自研VLA模型——MindVLA。VLA是机器人大模型的新范式,其将赋予自动驾驶3D空间理解能力、逻辑推理能力和行为生成能力,让自动驾驶能够感知、思考和适应环境。
MindVLA将为用户带来全新的产品形态和产品体验,有MindVLA赋能的汽车是听得懂、看得见、找得到的专职司机。“听得懂”是用户可以通过语音指令改变车辆的路线和行为; “看得见”是指MindVLA具备通识能力,拥有MindVLA赋能的车辆能够搜寻照片中的位置,并自动找到用户;“找得到”意味着车辆可以自主地在地库、园区和公共道路上漫游,整个过程不依赖地图或导航信息,完全依赖MindVLA的空间理解和逻辑推理能力。
来源:新浪网
(责任编辑:宋政 HN002)
0 条