DeepSeek API输入缓存价格降至首发价1/10

Rain科技4月26日消息,国产大模型DeepSeek官方宣布,全系API输入缓存命中价格下调至首发价的1/10,叠加限时优惠后,V4-Pro缓存输入低至0.025元/百万Tokens,创全球大模型价格新低。

本次调价覆盖DeepSeek-V4-Pro、V4-Flash全系列,核心降幅集中在输入缓存命中场景。

DeepSeek-V4-Pro:从1元降至0.1元/百万Tokens,5月5日前叠加2.5折,实付0.025元。

DeepSeek-V4-Flash:从0.2元降至0.02元/百万Tokens,无额外折扣。

DeepSeek API输入缓存降价!只有首发价格的1/10

缓存未命中与输出价格同步下调:V4-Pro输入(未命中)3元、输出6元;V4-Flash输入(未命中)1元、输出2元,均为原价1/4。

此次降价直击行业痛点,缓存输入价仅为GPT-5.5 Pro的1/700,大幅降低企业长文本、高频调用场景成本。

对RAG知识库、智能客服、文档分析等缓存命中率高的应用,成本可降90%以上。

DeepSeek API输入缓存降价!只有首发价格的1/10

技术端,DeepSeek-V4采用自研稀疏注意力架构,支持160k超长上下文,长文本处理效率领先。目前已适配华为云、阿里云等8大云平台及多家智算中心。

从行业视角来看,此次降价兼具战略与技术双重意义。一方面,缓存命中场景的定价逻辑直接对标企业实际使用习惯——长文本对话、多轮交互和知识库检索等高频重复查询,缓存命中率往往超过60%,按此计算实际成本甚至低于0.02元/百万Tokens,远低于行业平均的0.2~0.5元水平。另一方面,稀疏注意力架构的引入使得模型在保持160k上下文的条件下,计算复杂度从O(n²)降至接近O(n),这为极端低价提供了硬件效率支撑。相比OpenAI GPT-5.5 Pro缓存输入约17.5元/百万Tokens的价格,DeepSeek的定价优势接近700倍,直接冲击了海外厂商的定价体系。

业内认为,DeepSeek此举将重塑行业定价体系,加速AI应用普惠化,倒逼海外模型降价,巩固国产大模型成本优势。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 23小时前
下一篇 18小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!