太平洋科技行业

首页 > 科技要闻 > 科技> 正文

DeepSeek V4永久降价！缓存命中再打1折，实测编程成本骤降83%

量子位整合编辑：太平洋科技发布于：2026-04-27 18:05

由华为云驱动

2026年4月，DeepSeek宣布V4版本永久降价，输入缓存命中后价格再打1折，大幅降低编程成本83%。该举措由DeepSeek研究员陈德里在中国发布，旨在通过技术创新压低AI推理费用，引发行业震动。此次降价惠及学生、小型企业等用户，有望改变AI记忆处理方式，并推动全球市场竞争升级。

DeepSeek两天连续两次降价！

输入输出2.5折的基础上，命中缓存的输入折上折再打1折。

划重点了，输入缓存的折扣没有规定时限哦～

DeepSeek研究员陈德里也确认，输入缓存是永久降价，还打上了AGIforEveryone标签。

有学者表示，这将彻底改变人们处理AI记忆的方式。

原来发布时候的“迈入百万上下文普惠时代”是这个意思啊？

那么打折后到底省了多少钱？

只能说，比表面看起来还要更多。

实测编程整体节省83%

首先，Agent编程任务场景下，输入的比例远高于输出。

而且DeepSeek的缓存优化本来就做得好，V4-Pro的输入缓存命中率约95%，V4-Flash约91%。

也就是说，真实花费的绝大部分token，都是按输入（命中缓存）计算的。

在这一点上，V4-Pro每百万token只比V4-Flash贵了0.5分钱。

此前量子位测试消耗约3500万token，花费31.73元。

把数据发给DeepSeek，让他计算一遍，与真实花费相差无几。

但是！

按照打折后的新价格计算，只需要花5.34元了。

整体节省约83%，只花打折前17%的成本，就能获得同样的产出。

实际测试打折后消耗了1300万的V4-Pro token。

缓存命中率稍有提升到了约96%，输出token的占比与打折前测试的也差不多。

实际使用1300万token，花费2.36元，也基本符合计算结果。

价格屠夫回来了

降价引发行业震动，DeepSeek不是第一次干了。

这种商业策略与他们的技术理念高度一致，通过底层架构和算法的持续创新来压低模型推理成本，并将这些成本优势迅速转化为市场竞争力

早在2024年8月，DeepSeek就给V3降价，引发阿里云、字节等大厂更近，引发第一轮token价格战。

R1发布后，更是通过夜间空闲时段额外打折的方法，让价格战进一步升温。

这一次V4在开启价格战，对海外用户的心理冲击力还要更大。

如果按美元标价，小数点后有几位都快数不清楚了。

有网友总结，学生和AI初学者、小型企业都将受益匪浅。

最后，别忘了那行小字。

期待下半年，DeepSeek大规模部署华为算力后，价格还能给大家什么惊喜。

本文来源：量子位

DeepSeek降价缓存命中折扣编程成本节省

量子位

原创栏目

【专题】苹果全球开发者大会WWDC26报道

三星Galaxy S26系列现场上手：防窥屏杀疯了！

一款为不妥协而生的游戏显示器

换个视角看世界这台小相机有点东西

IT百科

抖音网页版怎么进入

iPhone12外观实锤！这2个问题还会重演吗？

AI大数据教你把妹儿？都是送人头的低俗趣味

我在双11买杜X斯的秘密怎么全网都知道？

收藏！买买买之后最该看的网购维权指南

比炒鞋更狂的炒盲盒

还去淘宝买iPhone有锁机？华强北的卖家都哭了

终于！AI开始对这届大学生们“下手了”

网友评论

甄选好物

推荐手机 笔记本 影像硬件家居商用企业出行未来

意见反馈回到顶部