国产AI考上文科一本线,期待中国人工智能取得更大突破

6月24日,极客公园发布了高考新课标Ⅰ卷大模型评测报告,GPT-4o以562分的成绩位居文科总分榜首。在国内产品中,字节跳动旗下的豆包大模型表现出色,以542.5分的成绩拔得头筹。此次评测使用的考卷与河南省高考卷完全一致,河南高考文科本科一批录取分数线为521分,豆包等三款国产AI成功突破了一本线。

人工智能参加高考早已不是新鲜事。早在2017年,一款名为“AI-MATHS”的高考机器人,在全封闭环境下,与全国文科高考生同场竞技,并在有监考老师和公证员的监督下,挑战了北京卷文科数学和全国二卷文科数学,分别取得了105分和100分的成绩,虽然距离110分的目标还有一定差距,但已经超越了众多对数学感到畏惧的考生。

时隔七年,包括GPT-4o、豆包、文心一言4.0、百小应等在内的近十款大模型再次同台竞技。三款国产AI成功突破一本线,再次引发社会热议。人工智能参加高考,绝非为了“好玩”。许多经历过高考洗礼的人感慨,高三是人生中最博学的一年,更是智力水平达到巅峰的时期。虽然这其中不乏调侃和夸张的成分,但高考的确在一定程度上反映了个体的综合素养。既然被称为“人工智能”,自然需要通过高考来验证其是否配得上这一称号,这也是最具说服力的证明方式之一。

随着人工智能技术的突破性发展,在围棋、自动驾驶等领域展现出强大的实力后,人工智能将目光投向了高考这一“新赛道”。通过高考,人工智能能够检验其学习和知识运用能力,与人类一决高下。不出意外,GPT-4o凭借其强大的实力夺得桂冠,而国产AI豆包的表现同样令人瞩目,不仅超过文科一本线20分,还在历史、化学两门学科中取得了第一名的好成绩。

值得一提的是,豆包的作文在匿名阅卷中获得了阅卷老师的赞赏。文章中对就业结构、伦理方面的担忧,展现了豆包已经具备了相当的思想深度和思辨能力。在提出“问题”后,豆包巧妙地运用反问句自然过渡,接着列举了三个排比段,提出了解决问题的方案——保持“问题意识”。文章中用发展的眼光分析问题,结合现实生活揭示问题产生的根源和危害,这些亮点让文章结构严谨、层层推进、语句流畅,体现了对问题的全面认识。

豆包技术能力明显领先于国内其他大模型,这并非偶然。根据智源研究院FlagEval大模型评测平台6月最新榜单,豆包大模型在主观评测和客观评测的综合成绩均位列前二,在知识运用和数学能力单项得分方面,客观评测排名第一,主观评测位居前三。

科学技术是第一生产力。数字经济时代来临,基于人工智能、5G技术、物联网等领域的科技创新,已成为提升国家综合国力和核心竞争力的关键。我们必须认识到,技术进步不是百米冲刺,而是漫长的长跑。ChatGPT的诞生,是世界顶尖科学家多年潜心研究的结果。十年磨一剑,方能一鸣惊人。

生成式对话产品的出现,意味着人类对自身进行了突破,也为未来科技发展指明了方向。现如今,生成式AI赛道已成为未来人工智能化发展的方向,就像多年前的AlphaGo一样,ChatGPT已成为人工智能发展史上的一个标志性符号。从这个意义上来说,它无法被复制,只能被超越。

科技是国家强盛之基,创新是民族进步之魂。正是基于对科技的高度重视,一年前中共中央、国务院发布了《党和国家机构改革方案》,将科技作为重要内容,引起了全世界的关注。与时俱进,方能领先一步。此举体现了中央对科技发展战略性、方向性、全局性重大问题的重视,由此释放出来的制度优势和政策红利,必将极大推动科技领域的创新创造。我们期待以豆包为代表的国产AI,能够乘着这股东风取得更大的突破,让世界刮目相看。

    免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
    (0)
    上一篇 2024年 7月 3日 下午12:16
    下一篇 2024年 7月 3日 下午12:27

    相关推荐

    欢迎来到AI快讯网,开启AI资讯新时代!