接入DeepSeek后,理想又为车机自研了一个推理模型:
它能帮你编故事哄孩子,提供买房建议,还能制定旅游攻略,直接筛掉你不想要的体验。
虽然此前的推理模型也能胜任这些任务,不过理想自研推理模型有所不同——
它能自主分析,你的问题需不需要思考,需要深度思考还是短思考。
在众多厂商争相接入DeepSeek的当下,理想选择了一条新的道路,打造了“汽车版DeepSeek”。这反映出理想在智能化方面的差异化竞争策略。
汽车版DeepSeek有什么特点?
为什么理想要投入大量资源自研推理模型,而不是直接采用DeepSeek?这是一个值得深入探讨的问题,涉及到成本、定制化程度、以及对未来技术发展的长期规划。
带着这些问题,智能车参考第一时间上车“拷问”了一番理想同学:
不是吧,你一句“我不喝豆汁儿”,它就真的能为你量身定制北京一日游攻略吗?这背后的技术实现令人好奇。
实测「汽车版DeepSeek」
更新理想OTA 7.2版本后,进入语音设置界面会看到一个深度思考的按钮,就像咱们日常用的DeepSeek一样,点击打开:
你也可以通过语音对话,让理想同学帮你打开。
不过与常见推理模型不同的是,即便打开了深度思考开关,理想同学也不会对每条对话都“陷入沉思”,而是模型自主决策是否需要思考,以及需要思考多久:
车控命令「不思考」,理想同学直接执行简单需求「短思考」,车机上方会显示生成中
复杂需求才「深度思考」,理想同学还会说「emmm,我得想想」
实际体验下来,像“我好热啊”、“腰好酸”、“还有多久到目的地”这类对话,即便处于「深度思考」模式下,理想同学也会分别打开空调、座椅按摩、显示目的地,瞬间响应,无需过多思考,确保了基本的交互效率。
而对于车主的一些复杂需求,例如,你想去北京旅游,但又不想品尝老北京豆汁儿,那就直接把定制攻略的需求告诉理想同学。
稍等几秒,一份私人定制的旅行攻略就生成了,精确到每个小时的行程安排、餐饮选择(避开了豆汁),以及大致的花费预算:
如果车上有孩子吵闹不睡觉,你可以让它即时创作一个故事来哄孩子:
与家人通话讨论买房事宜时,你也可以向理想同学寻求建议:
以上这些都是理想同学经过深度思考后给出的答案,而且相比常见的推理模型,响应速度更快。
能够自主选择思考的深度,并实现更快的深度思考,这背后究竟是如何实现的?
「汽车版DeepSeek」的实现过程
大家可能对理想此前自研的MindGPT比较熟悉,「汽车版DeepSeek」实际上是以MindGPT为基础模型,进行了后训练、指令微调以及强化学习等多阶段优化。
首先,鉴于模型能力与数据质量之间存在直接关联,理想在训练数据方面进行了非常细致的工作。
据介绍,理想基于过去已有的1100多个技能体系,根据问题的复杂程度和应用场景,对数据进行了精细的分类整理。这种精细化的数据处理是保证模型准确性的关键。
数据类型主要分为三种:
第一类,适合进行长推理的多轮对话样本,规模达到数十万级别,使用DeepSeek生成思考过程,然后将生成的结果作为训练深度思考能力的数据。这种方法利用了现有模型的知识来提升自身的能力。
第二类,不适合进行长推理,但仍然需要短思考的数据,同样借助DeepSeek加工形成短思考数据,规模约为十万级别。
第三类则是以往存储的不需要思考的数据,这部分数据量最大,据悉规模达到百万级别,理想从中进行了抽样使用。
这三类数据最终整合在一起对模型进行后训练,模型便具备了长思考能力,同时也能够自主决策是否需要思考,以及思考的程度。
完成模型训练后,理想又面临了另一个难题:
如何在进行深度思考的同时,又能更快地响应用户的需求? 这也是车载AI助手需要解决的关键问题。
理想关注的首要指标是首token响应时间,要求最快可达到0.3秒。这体现了对用户体验的高度重视。
背后主要采取了三项措施:
PD分离,将Prefill和Decoder分离部署。由于Prefill阶段对首Token的影响最大,这一阶段采用高性能Attention机制多卡并行推理工程优化。
从描述来看,实现过程似乎并不复杂,但实际上理想面临着诸多挑战。他们春节复工后便确定了4月初的产品更新时间,然后立即展开冲刺,时间紧迫,任务繁重。这反映了理想在技术研发上的高效率和执行力。
为什么理想不在车端直接使用DeepSeek,而是选择自研推理模型?
为什么自研车端推理模型?
据理想汽车透露,其打造车端推理模型主要出于内外两方面的因素:
实际上,此前理想的车主就表现出对这方面的需求。有些车主经常会向车机询问时事新闻,并希望了解背后的投资建议,例如最近金价的疯涨。
还有些车主在上班途中突然接到会议通知,但对会议主题涉及的市场情况不够了解,希望能让模型归纳相关信息并进行分析。这些用户需求是推动理想自研的重要动力。
过去的模型无法满足车主在这些方面的需求,因此理想开始考虑在车端部署推理模型。 这也是用户驱动创新的一个典型案例。
随后,DeepSeek在海内外市场的火爆加速了这一进程。
DeepSeek强大的影响力让许多用户首次认识到AI的强大能力,原来AI可以进行深度思考,并提供如此强大的分析能力。 这也推动了整个行业对AI技术的关注。
因此,有车主直接向理想提出疑问:
你们什么时候接入DeepSeek?
相信不只是理想,业内很多厂商都收到了类似的问题。这也是为什么春节复工后,众多车企争相宣布接入DeepSeek的原因。
实际上,理想同学App此前已经接入了完整版的DeepSeek。 这也说明理想对DeepSeek的技术能力是认可的。
既然如此,为什么理想还要在车端自研推理模型呢?
理想汽车认为,DeepSeek更适用于电脑和手机等终端场景,而车载场景则更加垂直,无论是车主的相关知识需求,还是对对话响应速度的要求,都需要打造一个“汽车版DeepSeek”。 这种定制化的需求是推动自研的关键因素。
现有的推理模型,通常思考时间较长,而且输出的内容也比较冗长,但车主并非每次对话都需要得到非常详尽的回应。“你是个好模型,只是咱们不太合适。” 这句话体现了理想对用户体验的精准把握。
因此,理想认为需要一个“汽车版的DeepSeek”,既能提高模型的思考能力,又能更灵活快速地响应车主的对话,避免车主提出问题后无法及时得到回复,或者回复内容过于冗长。 这种对效率和精准性的追求是车载AI发展的必然趋势。
模型能够自主决策是否进行思考以及思考的深度,这与目前主流的解决方案存在明显区别。 这种差异化设计能够更好地适应车载环境的需求。
这一特性是否有机会推广到其他应用场景? 这是一个值得思考的问题,或许在其他需要快速响应和精准判断的领域,这种技术也具有广阔的应用前景。
理想汽车也对未来的发展趋势做出了展望,这很可能成为后续AI助手应用的一个重要发展方向。AI助手将更加智能化和个性化,能够更好地满足用户的需求。
结合当前行业的发展情况,以及理想对理想同学的追求来看,或许未来理想会在端侧部署大模型,从而加快对车主相关需求的响应速度。这是一种可能的演进方向,能够进一步提升用户体验。
也有分析指出,英伟达Thor即将上车,其更充足的算力和前瞻性设计,也为未来实现“舱驾一体”提供了可能。这预示着未来车载AI将拥有更强大的计算能力和更广泛的应用场景。
能进行深度思考的理想同学,是不是离李想此前提出的“硅基家人”的愿景更近了一步呢? 这既是对未来的美好展望,也是对技术进步的期待。
理想自研的推理模型,解决你的痛点了吗?











