法国人工智能新锐Mistral近日高调宣布进军推理人工智能模型市场,于6月10日正式推出其首个推理模型系列——Magistral。此举标志着Mistral在竞争激烈的人工智能领域迈出了关键一步,直接对标OpenAI的o3模型和谷歌的Gemini 2.5 Pro等行业领先者。
此次发布的Magistral系列包含Magistral Small和Magistral Medium两个版本,旨在覆盖不同应用场景的需求。其中,Magistral Small模型拥有240亿参数,已通过Hugging Face平台开源发布,并采用Apache 2.0许可证。这一开放策略有望吸引更多开发者参与测试和改进,加速模型的迭代升级。与之相比,Magistral Medium则定位为功能更为强大的进阶模型,目前仅通过Mistral的Le Chat聊天平台、公司API以及指定的第三方合作伙伴云平台提供预览服务。这种差异化的发布策略,可能旨在先行锁定特定客户群体,获取宝贵的反馈意见,为后续的正式发布做好准备。
根据Mistral在官方博客中的介绍,Magistral系列模型的设计目标是高效解决复杂的多步骤问题,尤其侧重于提升在数学、物理等对逻辑一致性和结果可靠性要求极高的学科领域中的表现。为达成这一目标,Mistral对模型进行了精细化的微调,使其适用于结构化计算、程序化逻辑、决策树和基于规则的系统等广泛的企业级应用。更关键的是,Magistral模型强调可追溯的思考过程,这有助于提高模型决策的可解释性,从而增强用户对AI系统结果的信任度。
Mistral是一家成立于2023年,专注于前沿模型研发的人工智能实验室。除了Le Chat聊天机器人和相关的移动应用程序外,Mistral还致力于构建一系列人工智能驱动的服务生态。得益于General Catalyst等知名风险投资机构的支持,Mistral已成功融资超过11亿欧元(约合90.22亿元人民币),为其持续的研发投入提供了坚实的资金保障。雄厚的资金实力也让Mistral有更多底气与行业巨头展开竞争。
尽管拥有显著的资金优势,Mistral在推理模型领域的起步相对较晚,与行业领先的人工智能实验室相比仍有差距。从Mistral自身公布的基准测试结果来看,Magistral在GPQA Diamond和AIME等专门评估模型在物理、数学和科学领域能力的测试中,其性能表现略逊于Gemini 2.5 Pro和Anthropic的Claude Opus 4。此外,在业界广泛使用的编程基准测试LiveCodeBench中,Magistral也未能超越Gemini 2.5 Pro的表现。这些数据表明,Mistral在部分专项能力上仍有提升空间。
然而,Mistral并未因此而气馁,而是将重点放在Magistral的其他优势上。在官方博客文章中,Mistral突出强调了Magistral在Le Chat平台上的响应速度,声称其答题速度是竞争对手的10倍。更重要的是,Magistral支持多种语言,包括意大利语、阿拉伯语、俄语和简体中文。这一特性使其在处理多语言任务时展现出更高的灵活性和适应性,能够更好地满足全球用户的需求。考虑到全球化趋势日益明显,多语言支持无疑是Magistral的一大亮点,有助于其在特定市场建立优势。

进一步地,Mistral在文章中明确指出,Magistral的设计重点在于为研究、战略规划、运营优化和数据驱动的决策提供支持。无论是在执行多因素风险评估和建模,还是在面临约束条件的情况下计算最优交付窗口,Magistral都能够展现出色的性能。这意味着Magistral的目标客户主要锁定为需要处理复杂决策的企业用户,并希望通过AI的能力提升运营效率和决策质量。
值得关注的是,Magistral的发布时间紧随Mistral推出“氛围编程”客户端Mistral Code之后。在此之前,Mistral还发布了一系列专注于编程的模型,并推出了面向企业的聊天服务Le Chat Enterprise。该企业级服务提供了例如人工智能代理构建器等实用工具,并将Mistral的模型与包括Gmail和SharePoint在内的第三方服务进行了深度集成。这一系列举措相互呼应,共同构建了Mistral在人工智能领域的全面布局,充分展示了其雄厚的实力和远大的目标。