在备受瞩目的NVIDIA GTC 2025大会上,卓驭AI首席执行官陈晓智发表了重要演讲,主题为“基于端到端世界模型的生成式智驾体验”。本次演讲不仅展示了卓驭在智能驾驶技术方面的最新进展,更首次公开了其颠覆性创新成果——GenDrive,一款支持自然语言交互的个性化生成式智能驾驶方案。
卓驭认为,未来高级别智能驾驶的发展方向,不仅仅是模拟人类驾驶行为,更重要的是满足用户日益增长的个性化需求。基于这一前瞻性理念,卓驭率先提出了“生成式智驾”的概念,并将其具象化为GenDrive方案。与依赖预设规则的传统智能驾驶系统相比,生成式智驾旨在提供更加人性化、可定制的驾驶体验,根据不同用户的驾驶习惯和偏好进行动态调整。
传统端到端智能驾驶架构通常采用预测范式,即根据传感器输入信息预测车辆的下一步动作。然而,卓驭GenDrive的核心在于采用了更先进的生成式技术。该方案通过构建世界模型,能够模拟和预测未来可能出现的多种驾驶场景,并结合用户偏好、实时环境信息等因素,选择最优的行驶轨迹。这种方式更接近于人类驾驶员的决策过程,也为个性化定制提供了更大的空间。
卓驭的端到端世界模型架构由强大的硬件平台和复杂的软件算法构成。底层硬件平台能够适配包括英伟达DRIVE Orin / Thor SoC在内的多种高性能计算平台,并支持不同类型的传感器配置,保证了系统的灵活性和可扩展性。在模型输入端,系统通过Vision Encoder和Tokenizers对传感器数据、导航信息以及历史驾驶轨迹进行编码,提取关键特征。更重要的是,用户的驾驶风格偏好和语音指令被巧妙地融入到模型中,这使得输出结果更加精准和个性化。例如,用户之前喜欢快速超车,或者经常使用某条特定的路线,这些信息都会被模型记录和学习。
模型输出方面,卓驭的方案不仅能够实现对周围环境的语义和几何理解,还能生成未来多种可能的驾驶场景,如同人类驾驶员在脑海中预演各种情况。最终生成的驾驶轨迹,则是与用户驾驶风格偏好和语音指令完美对齐的结果,力求为用户带来前所未有的个性化驾驶体验。可以设想,未来智能驾驶不再是千篇一律的机械操作,而是能够真正理解用户意图、提供定制服务的“智能副驾”。

在模型训练方面,卓驭采用了大模型领域常见的预训练+后训练模式,实现了“硬件无关”的平台化训练。这意味着,针对不同的传感器配置和芯片类型,只需训练一个通用模型,即可轻松部署到不同的硬件平台上,极大地提高了开发效率和灵活性。这种训练方式降低了智能驾驶技术的准入门槛,有利于更快地实现技术的普及和应用。
基于上述先进架构,卓驭的生成式智能驾驶方案GenDrive具备一系列令人期待的功能。用户能够自定义场景级别的驾驶风格,具体到跟车距离、速度控制、路口转弯和变道策略等细节。 更为强大的是,GenDrive还支持在线学习和模仿用户的驾驶风格。通过分析一段时间的驾驶数据,模型就能自动学习用户的偏好,例如加速习惯、变道偏好等。结合车内人脸识别技术,系统能够自动识别不同用户的ID,并激活相应的驾驶风格,真正实现千人千面的驾驶体验。

GenDrive最令人印象深刻的功能之一是其对自然语言交互的支持。用户可以通过简单的语音指令来控制驾驶风格和具体动作,而无需进行复杂的设置。例如,如果乘客感到不适,可以简单地说一句“开慢点”,系统就会自动降低车速并采取更平缓的驾驶策略。或者,用户可以指示系统“不要走最左边的车道”,模型也能准确理解用户意图并实时调整行驶轨迹。 这种交互方式极大地提升了用户体验,使智能驾驶系统更加易用和人性化。

根据卓驭官方消息,这一突破性的生成式智能驾驶体验预计将在今年内搭载于量产车型上,正式推向市场。 GenDrive的量产落地,不仅将为智能驾驶领域带来一场革命性的变革,也将重新定义人与汽车的交互方式,为用户带来更加安全、舒适和个性化的出行体验。