2025高考数学大考：AI谁最聪明？DeepSeek、讯飞星火突破140分大关！

2025年高考数学考试落下帷幕，考生们对试卷难度的讨论甚嚣尘上，数学科目尤其引发热议。作为科技领域的观察者，我们关注到这一现象，并产生了一个疑问：今年的高考数学试卷，对于炙手可热的AI大模型来说，难度究竟如何？它们能否轻松应对，甚至超越人类考生？

为解答这个问题，我们精心设计了一场模拟“高考”，邀请了七位国内外的知名AI大模型参与，它们分别是：DeepSeek R1 0528、通义千问 Qwen3-235B-A22B、讯飞星火 X1-0420、豆包 Seed-Thinking-v1.5、文心 X1 Turbo、腾讯混元 Hunyuan T1 latest以及OpenAI的GPT o3。我们采用一套完整且经过验证的高考数学试卷，对它们的数学解题能力进行全面测试。为了保证结果的客观性和专业性，我们还特别邀请了经验丰富的数学教研专家汪鹏老师担任评分工作。

需要指出的是，由于网络上流传的试卷版本繁多且存在差异，为了确保评测的准确性，我们采取了多版本交叉验证，并结合教师解题验证的方式，力求还原最真实的高考试卷难度。本次模拟考试的总分设定为150分，旨在全面考察AI模型的数学素养和解题能力。

2025高考数学大考：AI谁最聪明？DeepSeek、讯飞星火突破140分大关！

首先，我们从一道较为基础的选择题入手。令人欣喜的是，对所有参与测试的AI大模型来说，这道题目都显得“小菜一碟”。DeepSeek R1、通义千问、讯飞星火、豆包、文心一言、腾讯混元以及GPT o3均能迅速给出正确答案。这初步展示了AI在处理基础数学问题上的能力。

为了增加难度，我们随后考察了一道涉及函数的进阶选择题。结果显示，这些AI大模型同样表现出色，全部成功解答。这进一步证明了它们在理解和运用函数相关概念，以及处理数学逻辑问题上的强大能力。这些模型似乎已经掌握了解决函数问题的基本方法。

然而，当题目难度提升，涉及到更复杂的对数函数时，AI大模型们便展现出了不同的解题能力。DeepSeek R1和豆包在这道题目上出现了错误，表明它们在某些特定类型的复杂数学问题上存在局限性。而其他AI大模型则成功给出了正确答案，显示出它们在处理复杂数学问题时具备一定的优势。这说明AI在数学能力上的发展并不均衡，不同模型之间存在差异。

进入解答题环节，我们选取了第16题作为案例进行分析。这道题综合考察了数列和函数知识点，不仅要求AI给出正确答案，更重要的是，需要它们清晰地展示完整的解题过程。DeepSeek R1、通义千问、讯飞星火和豆包在这道题上表现出色，不仅答案正确，解题步骤也清晰完整，因此获得了满分。相比之下，文心一言和腾讯混元则因为在解题过程中出现了错误而失分。这说明在需要进行复杂推理和详细步骤展示的题目上，部分AI模型还需要进一步提升。

2025高考数学大考：AI谁最聪明？DeepSeek、讯飞星火突破140分大关！

最后，我们挑战了难度最高的第18题，这道题旨在考察AI对数学知识的综合应用和解题策略的选择。令人印象深刻的是，讯飞星火、豆包、DeepSeek R1、通义千问以及GPT o3均在这道题上获得了满分，展现出它们在处理高难度数学问题上的巨大潜力。而文心X1则因答案错误而失分，再次印证了AI在应对复杂数学挑战时表现存在差异。

最终，经过这场模拟“高考”，DeepSeek R1以143分的优异成绩位列榜首，讯飞星火以141分紧随其后，GPT o3则以138分获得第三名。这些AI大模型在数学能力上的出色表现令人瞩目，充分展示了AI在教育领域的巨大应用潜力。值得注意的是，即使是表现最好的模型，也并非完美，在某些特定类型的题目上仍然存在失误。

值得深入分析的是，虽然DeepSeek R1在总分上领先，但其在OCR识别效果和推理速度方面仍存在一定的短板，这意味着其在实际应用中可能会遇到一些限制。而讯飞星火则凭借其相对较小的模型量级和高效的数学能力，展现出了强大的竞争力，预示着轻量级AI模型在特定领域的应用前景。豆包、通义千问等大模型也表现出色，其数学能力已经达到了国际顶尖模型水平。这些模型在不同的方面展现出各自的优势，也为AI在数学教育领域的应用提供了更多可能性。

此次AI大模型参与“2025高考数学”考试，不仅仅是对AI数学能力的一次检验，更是一次对AI在教育领域应用潜力的积极探索。结果表明，AI在解决数学问题上已经具备相当的能力，但在逻辑推理、解题步骤的完整性以及特定类型题目的掌握程度上还有待提高。随着AI技术的不断发展，我们有理由相信，AI将在未来的教育领域中发挥越来越重要的作用，例如个性化辅导、智能题库构建、以及辅助教师进行教学等，为教育带来革命性的变革。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

2025高考数学大考：AI谁最聪明？DeepSeek、讯飞星火突破140分大关！

关于作者

AI快讯网编辑-青青

发表回复