AI大考高考数学:DeepSeek等四款大模型满分夺冠,谁是真学霸

一年一度的高考备受瞩目,2025 年高考期间,为确保考试的公平性,包括腾讯混元、通义千问、Kimi 和豆包在内的多家国内知名 AI 大模型,主动关闭了图像识别问答功能。此举旨在防止考生利用 AI 技术进行作弊,凸显了相关企业对于维护考场纪律的责任感和对 AI 可能被滥用的潜在风险的预判。但与此同时,也有部分声音认为,这些企业或许有些高估了自家 AI 大模型在解答高难度问题上的能力,部分此前公开测试表明,这些 AI 在处理复杂的高考题目时,表现并不能完全令人满意。

随着 2025 年高考全国一卷部分科目试卷的公布,例如语文、英语和数学,公众和媒体的关注点再次转向了 AI 大模型的能力,尤其是对数学科目的挑战。人们好奇:这些 AI 大模型是否能够像一个真正的学生一样,独立解答高考数学题目?这种“人机大战”也具备一定的现实意义,即探讨 AI 在教育领域的潜在应用价值和发展方向。

AI大考高考数学:DeepSeek等四款大模型满分夺冠,谁是真学霸

为了客观评估 AI 在数学解题方面的能力,有人组织了一场模拟“高考”,选取了六款有代表性的 AI 大模型:DeepSeek、豆包、讯飞星火、文心一言、Kimi 和通义千问。测试环境允许这些 AI 联网并使用深度思考功能,模拟真实考试场景。题目涵盖了数学试卷常见的各种类型,包括单选题、多选题、填空题和简答题,旨在全面考察 AI 的数学解题能力。

首轮测试选取了一道关于双曲线离心率的题目。这道题对于六款 AI 大模型来说似乎并无难度,所有 AI 模型均正确解答,且都提供了详细的推理过程,可谓旗开得胜。首轮测试也侧面证明了 AI 在处理基础数学问题方面的卓越能力。

AI大考高考数学:DeepSeek等四款大模型满分夺冠,谁是真学霸

然而,随着题目难度的逐渐提升,各 AI 大模型之间的表现差异也开始逐步显现。第二题是一道关于三角形和正弦函数的题目,这道题让部分 AI 大模型在计算上花费了较长的时间。其中,豆包快速给出了正确答案,而讯飞星火和通义千问虽然最终也得出了正确答案,但耗时明显更长。DeepSeek 则更是耗时接近 10 分钟才完成解答,效率相对较低。

AI大考高考数学:DeepSeek等四款大模型满分夺冠,谁是真学霸

第三题考查的是等比数列,这款题目对于多数 AI 大模型来说,并没有造成太大的阻碍,基本都能快速得出正确答案。唯有豆包在输出答案时出现了一点小小的失误,排除掉了一个正确答案的选项。但是到了第四题,一个关于数列和函数的综合难题,再次考验了这些 AI 大模型的深入计算和逻辑推理能力。在这一轮测试中,豆包、讯飞星火、Kimi、文心一言和 DeepSeek 依然表现出色,成功解答了该题目,而通义千问则表现略逊一筹,未能正确解答。

AI大考高考数学:DeepSeek等四款大模型满分夺冠,谁是真学霸

AI大考高考数学:DeepSeek等四款大模型满分夺冠,谁是真学霸

经过四轮比拼,DeepSeek、讯飞星火、Kimi 和文心一言凭借稳定的发挥和强大的解题能力,以满分的成绩脱颖而出。豆包虽然因一时疏忽丢掉了 3 分,但整体实力依然不容小觑。通义千问在处理相对简单的问题时表现尚可,但面对复杂问题时,则显得有些力不从心,需要提升在复杂问题上的解答能力。

这场模拟“高考”不仅是一次对 AI 大模型数学解题能力的检验,也让我们看到了 AI 在教育领域,特别是在智能辅导方面的巨大应用潜力。随着 AI 技术的持续进步,学习机厂商和教育辅导平台或可考虑与这些头部 AI 企业展开深度合作,共同研发新一代的 AI 教育硬件产品和服务,为学生提供更加个性化、高效和智能的学习辅助工具,助力教育行业的智能化升级。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
上一篇 2025年 6月 11日 上午10:01
下一篇 2025年 6月 11日 上午10:57

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!