实测车载DeepSeek:做北京旅游攻略,避开豆汁儿

接入DeepSeek后,理想又为车机自研了一个推理模型:

它能帮你编故事哄孩子,提供买房建议,还能制定旅游攻略,直接筛掉你不想要的体验。

虽然此前的推理模型也能胜任这些任务,不过理想自研推理模型有所不同——

它能自主分析,你的问题需不需要思考,需要深度思考还是短思考。

在众多厂商争相接入DeepSeek的当下,理想选择了一条新的道路,打造了“汽车版DeepSeek”。这反映出理想在智能化方面的差异化竞争策略。

汽车版DeepSeek有什么特点?

为什么理想要投入大量资源自研推理模型,而不是直接采用DeepSeek?这是一个值得深入探讨的问题,涉及到成本、定制化程度、以及对未来技术发展的长期规划。

带着这些问题,智能车参考第一时间上车“拷问”了一番理想同学:

不是吧,你一句“我不喝豆汁儿”,它就真的能为你量身定制北京一日游攻略吗?这背后的技术实现令人好奇。

实测「汽车版DeepSeek」

更新理想OTA 7.2版本后,进入语音设置界面会看到一个深度思考的按钮,就像咱们日常用的DeepSeek一样,点击打开:

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

你也可以通过语音对话,让理想同学帮你打开。

不过与常见推理模型不同的是,即便打开了深度思考开关,理想同学也不会对每条对话都“陷入沉思”,而是模型自主决策是否需要思考,以及需要思考多久:

车控命令「不思考」,理想同学直接执行简单需求「短思考」,车机上方会显示生成中

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

复杂需求才「深度思考」,理想同学还会说「emmm,我得想想」

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

实际体验下来,像“我好热啊”、“腰好酸”、“还有多久到目的地”这类对话,即便处于「深度思考」模式下,理想同学也会分别打开空调、座椅按摩、显示目的地,瞬间响应,无需过多思考,确保了基本的交互效率。

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

而对于车主的一些复杂需求,例如,你想去北京旅游,但又不想品尝老北京豆汁儿,那就直接把定制攻略的需求告诉理想同学。

稍等几秒,一份私人定制的旅行攻略就生成了,精确到每个小时的行程安排、餐饮选择(避开了豆汁),以及大致的花费预算:

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

如果车上有孩子吵闹不睡觉,你可以让它即时创作一个故事来哄孩子:

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

与家人通话讨论买房事宜时,你也可以向理想同学寻求建议:

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

以上这些都是理想同学经过深度思考后给出的答案,而且相比常见的推理模型,响应速度更快。

能够自主选择思考的深度,并实现更快的深度思考,这背后究竟是如何实现的?

「汽车版DeepSeek」的实现过程

大家可能对理想此前自研的MindGPT比较熟悉,「汽车版DeepSeek」实际上是以MindGPT为基础模型,进行了后训练、指令微调以及强化学习等多阶段优化。

首先,鉴于模型能力与数据质量之间存在直接关联,理想在训练数据方面进行了非常细致的工作。

据介绍,理想基于过去已有的1100多个技能体系,根据问题的复杂程度和应用场景,对数据进行了精细的分类整理。这种精细化的数据处理是保证模型准确性的关键。

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

数据类型主要分为三种:

第一类,适合进行长推理的多轮对话样本,规模达到数十万级别,使用DeepSeek生成思考过程,然后将生成的结果作为训练深度思考能力的数据。这种方法利用了现有模型的知识来提升自身的能力。

第二类,不适合进行长推理,但仍然需要短思考的数据,同样借助DeepSeek加工形成短思考数据,规模约为十万级别。

第三类则是以往存储的不需要思考的数据,这部分数据量最大,据悉规模达到百万级别,理想从中进行了抽样使用。

这三类数据最终整合在一起对模型进行后训练,模型便具备了长思考能力,同时也能够自主决策是否需要思考,以及思考的程度。

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

完成模型训练后,理想又面临了另一个难题:

如何在进行深度思考的同时,又能更快地响应用户的需求? 这也是车载AI助手需要解决的关键问题。

理想关注的首要指标是首token响应时间,要求最快可达到0.3秒。这体现了对用户体验的高度重视。

背后主要采取了三项措施:

PD分离,将Prefill和Decoder分离部署。由于Prefill阶段对首Token的影响最大,这一阶段采用高性能Attention机制多卡并行推理工程优化。

从描述来看,实现过程似乎并不复杂,但实际上理想面临着诸多挑战。他们春节复工后便确定了4月初的产品更新时间,然后立即展开冲刺,时间紧迫,任务繁重。这反映了理想在技术研发上的高效率和执行力。

为什么理想不在车端直接使用DeepSeek,而是选择自研推理模型?

为什么自研车端推理模型?

据理想汽车透露,其打造车端推理模型主要出于内外两方面的因素:

实际上,此前理想的车主就表现出对这方面的需求。有些车主经常会向车机询问时事新闻,并希望了解背后的投资建议,例如最近金价的疯涨。

还有些车主在上班途中突然接到会议通知,但对会议主题涉及的市场情况不够了解,希望能让模型归纳相关信息并进行分析。这些用户需求是推动理想自研的重要动力。

过去的模型无法满足车主在这些方面的需求,因此理想开始考虑在车端部署推理模型。 这也是用户驱动创新的一个典型案例。

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

随后,DeepSeek在海内外市场的火爆加速了这一进程。

DeepSeek强大的影响力让许多用户首次认识到AI的强大能力,原来AI可以进行深度思考,并提供如此强大的分析能力。 这也推动了整个行业对AI技术的关注。

因此,有车主直接向理想提出疑问:

你们什么时候接入DeepSeek?

相信不只是理想,业内很多厂商都收到了类似的问题。这也是为什么春节复工后,众多车企争相宣布接入DeepSeek的原因。

实际上,理想同学App此前已经接入了完整版的DeepSeek。 这也说明理想对DeepSeek的技术能力是认可的。

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

既然如此,为什么理想还要在车端自研推理模型呢?

理想汽车认为,DeepSeek更适用于电脑和手机等终端场景,而车载场景则更加垂直,无论是车主的相关知识需求,还是对对话响应速度的要求,都需要打造一个“汽车版DeepSeek”。 这种定制化的需求是推动自研的关键因素。

现有的推理模型,通常思考时间较长,而且输出的内容也比较冗长,但车主并非每次对话都需要得到非常详尽的回应。“你是个好模型,只是咱们不太合适。” 这句话体现了理想对用户体验的精准把握。

因此,理想认为需要一个“汽车版的DeepSeek”,既能提高模型的思考能力,又能更灵活快速地响应车主的对话,避免车主提出问题后无法及时得到回复,或者回复内容过于冗长。 这种对效率和精准性的追求是车载AI发展的必然趋势。

实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种

模型能够自主决策是否进行思考以及思考的深度,这与目前主流的解决方案存在明显区别。 这种差异化设计能够更好地适应车载环境的需求。

这一特性是否有机会推广到其他应用场景? 这是一个值得思考的问题,或许在其他需要快速响应和精准判断的领域,这种技术也具有广阔的应用前景。

理想汽车也对未来的发展趋势做出了展望,这很可能成为后续AI助手应用的一个重要发展方向。AI助手将更加智能化和个性化,能够更好地满足用户的需求。

结合当前行业的发展情况,以及理想对理想同学的追求来看,或许未来理想会在端侧部署大模型,从而加快对车主相关需求的响应速度。这是一种可能的演进方向,能够进一步提升用户体验。

也有分析指出,英伟达Thor即将上车,其更充足的算力和前瞻性设计,也为未来实现“舱驾一体”提供了可能。这预示着未来车载AI将拥有更强大的计算能力和更广泛的应用场景。

能进行深度思考的理想同学,是不是离李想此前提出的“硅基家人”的愿景更近了一步呢? 这既是对未来的美好展望,也是对技术进步的期待。

理想自研的推理模型,解决你的痛点了吗?

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 2025年 4月 5日 上午12:04
下一篇 2025年 4月 5日 上午3:46

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!