谷歌Gemini 2.5 Pro挑战成功!29年前《宝可梦蓝》被AI通关

谷歌人工智能领域传来重大突破,其最新研发的Gemini 2.5 Pro模型在一款发布于29年前的经典电子游戏《宝可梦蓝》中取得了历史性成就——成功通关。这一进展不仅彰显了谷歌在人工智能领域的强大实力,也引发了人们对于大型语言模型(LLM)在复杂任务处理方面能力的广泛讨论。

谷歌Gemini 2.5 Pro挑战成功!29年前《宝可梦蓝》被AI通关

谷歌首席执行官桑达尔·皮查伊在社交媒体上兴奋地宣布了这一消息,称“真是令人惊叹!Gemini 2.5 Pro已经成功通关《宝可梦蓝》!” 这场名为“Gemini Plays Pokemon”的直播活动并非由谷歌官方发起,而是由一位名为Joel Z的30岁软件工程师主导。然而,该项目却获得了谷歌高层的鼎力支持,这表明谷歌对于这一突破性进展的高度重视。

据了解,早在直播活动前一个月,谷歌AI Studio的产品负责人洛根·基尔帕特里克就透露,Gemini在《宝可梦》系列游戏中已经取得了显著进展,并已获得五个徽章。相比之下,当时表现第二的模型仅获得三个徽章,尽管它们使用了不同的代理框架。皮查伊还幽默地表示,谷歌正在研发API,即“人工宝可梦智能”。

那么,谷歌为何选择《宝可梦》作为人工智能的挑战对象?这背后有着怎样的战略考量? 早在今年2月,Anthropic公司就曾展示其Claude AI模型在《宝可梦红》中的出色表现,并强调Claude的“深度思考和代理训练”能力使其在处理复杂任务时更具优势。尽管Claude表现优异,但似乎并未完全通关《宝可梦红》。 这是否意味着Gemini在游戏领域的能力更胜一筹呢?

面对这种猜测,Joel Z在Twitch页面上谨慎提醒观众:“请勿将此次成就视为衡量大型语言模型(LLM)在《宝可梦》游戏中表现的唯一标准。Gemini和Claude使用不同的工具和接收到的信息差异较大,因此无法进行直接比较。” 他强调了不同模型所使用的工具和信息的差异性,从而避免了直接对比可能带来的误解。 这种客观的分析凸显了评估人工智能能力时,需要综合考虑不同因素的复杂性。

值得注意的是,不论是Gemini还是Claude,两款AI模型在玩游戏时都需要借助代理框架。这些框架能够为模型提供带有额外信息的游戏截图,从而帮助模型做出决策,并模拟按下与AI指令相对应的按钮。 代理框架在其中扮演了至关重要的角色,它为人工智能模型提供了一个理解和操作游戏环境的桥梁。

尽管在帮助Gemini完成游戏的过程中,Joel Z进行了一些“开发干预”,但他坚称这并非作弊,而是为了提升Gemini的整体决策和推理能力。“我的干预并未涉及给出具体提示词或为特定挑战提供攻略或直接指令,”Joel Z解释道,“唯一接近这种情况的是,我告诉Gemini需要与火箭队小兵对话两次才能获得升空钥匙,这实际上是一个在《宝可梦黄》中被修复的漏洞。”
他进一步表示,“Gemini Plays Pokémon仍在积极开发中,其框架也在不断演进和完善。” Joel Z的干预旨在优化Gemini的表现,而不是直接提供答案,这体现了其对于人工智能能力提升的关注点在于模型的学习能力和推理能力。

总而言之,Gemini 2.5 Pro成功通关《宝可梦蓝》是谷歌在人工智能领域的一项重要进展。 尽管我们不能简单地将此成就作为衡量不同LLM之间能力的唯一标准,但它无疑展示了人工智能在解决复杂问题方面的巨大潜力。 随着AI技术的不断发展,我们有理由期待未来人工智能将在更多领域取得突破。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2025年 5月 4日 上午8:55
下一篇 2025年 5月 4日 上午11:24

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!