
理想汽车发布下一代自动驾驶模型MindVLA-o1,定义物理AI发展起点
发布背景与核心定位
3月17日,理想汽车在2026 GTC大会上,由基座模型负责人詹锟正式发布下一代自动驾驶模型MindVLA-o1。该模型实现对3D空间的完整理解,统一空间理解、思考推理及驾驶行为,并可同时控制车辆与机器人,将自动驾驶定义为物理AI的发展起点。
技术突破:3D ViT模型解决传统方案瓶颈
针对行业传统自动驾驶方案的技术局限(如BEV方案丢失高度信息、OCC占用网络缺乏语义碰撞判断能力),MindVLA-o1采用原生3D ViT视觉模型:
- 通过视频流直接还原3D空间的位置、点云、语义与像素信息;
- 训练中融合视觉语义与激光雷达几何数据,引入前馈式3DGS表示(分别建模静动态场景);
- 自监督学习实现未来场景状态预测,输出高质量3D世界表征,解决传统方案的信息完整性与决策基础问题。
算力支撑:自研马赫100芯片保障落地
理想自研的马赫100芯片在标准大规模矩阵乘任务上性能较上一代提升3倍,为车规级新架构落地提供核心算力保障。
多模态思考框架提升决策能力
模型搭载新一代多模态思考框架,融合语言推理与空间推演能力,引入System-2显式推理机制与预测式隐世界模型,可在隐空间高效完成未来场景模拟与复杂决策推演。
具身智能框架推动通用物理世界智能体演化
理想已搭建完整的具身智能AI框架,通过统一数据引擎、VLA模型、仿真系统与强化学习基础设施,实现模型跨智能体复用,推动基础模型向通用物理世界智能体持续演化。
总结:MindVLA-o1通过3D空间理解、多模态推理、算力升级及具身智能框架,构建了更接近真实物理世界的自动驾驶能力,为行业技术突破提供方向。
一站式数字化解决方案服务商 —— 专业提供软件开发、网站设计、APP 与小程序开发,搭载低费率支付通道,结合创意广告设计,助力企业全链路数字化升级。
- 使用本网站请联系客服
- 点击关注微信公众号:乐鱼网络
- 点击-在线客服