Gemini 2.5系列模型更新,轻量版Flash-Lite实现实时编写操作系统

Gemini 系列模型迎来了新的一波更新:

  • Gemini 2.5 Pro 稳定版已全面可用,其与 6 月 5 日的预览版相比无变化。
  • Gemini 2.5 Flash 稳定版已全面可用,与 5 月 20 日的预览版相比无变化,但价格有所更新。
  • 新推出的 Gemini 2.5 Flash-Lite 开始了预览。

Gemini 2.5系列模型更新,轻量版Flash-Lite实现实时编写操作系统

谷歌 CEO Sundar Pichai 在推特上表示,新推出的 Gemini 2.5 Flash-Lite 是目前性价比最高的 2.5 系列模型。

Gemini 2.5系列模型更新,轻量版Flash-Lite实现实时编写操作系统

从官方的定位来看,Gemini 2.5 Flash-Lite 非常适合用于“量大且注重成本效率的任务”。相比之下,Gemini 2.5 Pro 适合编程和高复杂度任务,而 Gemini 2.5 Flash 则居中,更适合需要较快速度的日常任务。

Gemini 2.5系列模型更新,轻量版Flash-Lite实现实时编写操作系统

根据官方博客,Gemini gays 2.5 Flash-Lite 也是一个支持多模态输入和 100 万 token 上下文的推理模型,并且可以通过 API 参数动态控制思考预算。由于 Flash-Lite 针对成本和速度进行了优化,因此其“思考”功能默认处于关闭状态。除了函数调用外,2.5 Flash-Lite 还支持已有的所有原生工具,例如基于谷歌搜索查找依据、代码执行和 URL 上下文。

在性能方面,Gemini 2.5 Flash-Lite 的整体表现自然会比 2.5 Flash 差一些,而开启思考的版本也比未开启的更强。但在某些特定指标上,2.5 Flash-Lite 意外地具有少量优势,例如 AIME 2025 和 FACTS Grounding。

Gemini 2.5系列模型更新,轻量版Flash-Lite实现实时编写操作系统

价格方面,2.5 Flash-Lite 的定价为每百万输入/输出 token 0.1/0.4 美元,音频输入为每百万输入 token 0.5 美元。2.5 Flash 的价格为每百万输入/输出 token 0.3/2.5 美元,音频输入为 1 美元。性能最佳的 2.5 Pro 价格则为每百万输入/输出 token 1.25/10 美元。

目前,Gemini 2.5 Flash-Lite 的预览版已在 Google AI Studio 和 Vertex AI 上线,与 2.5 Flash 和 Pro 的稳定版本一同提供。用户也可在 Gemini App 中使用 2.5 Flash 和 Pro。此外,谷歌还为 2.5 Flash-Lite 和 2.5 Flash 的定制版本引入了搜索功能。

此外,谷歌发布了新版本的 Gemini 2.5 技术报告,从中我们可以看到更多关于 Gemini 2.5 Flash-Lite 的信息。报告指出,Gemini 系列模型共同组成了目前 LLM 的佩雷托前沿,是性价比最高的系列模型。

Gemini 2.5系列模型更新,轻量版Flash-Lite实现实时编写操作系统

报告中还提到了一种名为“智能体恐慌(agent panic)”的现象,即在游戏过程中,Gemini 2.5 Pro 遇到了多种可能导致模型模拟“恐慌”的情况。例如,当队伍中的宝可梦生命值或能量值较低时,模型会反复提醒自己需要立即治疗队伍或逃离当前地牢。有趣的是,这种模型性能模式似乎与模型推理能力的定性可观察到的下降相关,例如在这种情况持续期间,游戏过程中完全忘记使用探路工具。

Gemini 2.5系列模型更新,轻量版Flash-Lite实现实时编写操作系统

Gemini 2.5系列模型更新,轻量版Flash-Lite实现实时编写操作系统

报告地址:https://storage.googleapis.com/deepmind-media/gemini/gemini_v2_5_report.pdf

作为当今 AI 模型的顶流之一,Gemini 更新自然吸引了广泛关注。许多用户已经尝试并分享了自己的体验。例如,Datasette 开发者、著名技术博主 Simon Willison 用一篇博客分享了自己的体验,展示了 2.5 Pro、2.5 Flash 和 2.5 Flash-Lite 生成的鹈鹕骑自行车 SVG 的效果。

Gemini 2.5系列模型更新,轻量版Flash-Lite实现实时编写操作系统

https://simonwillison.net/2025/Jun/17/gemini-2-5/

输出 token 数分别为 4,226、14,500、2,070,对应成本分别为 4.2274、3.6253、0.0829 美分。

此外,他还尝试了将一个新的 Twitter Space 的录音转录成文本。结果发现,2.5 Pro 的效果最好,总成本为 18.1 美分,时间 147.5 秒;2.5 Flash 也不错,消耗 10 美分和 72.6 秒。但 2.5 Flash-Lite 却遭遇了错误,中途卡住了。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
上一篇 2025年 6月 18日 上午10:01
下一篇 2025年 6月 18日 下午12:30

相关推荐

欢迎来到AI快讯网,开启AI资讯新时代!