量子位
整合编辑:太平洋科技
发布于:2026-04-27 18:05
2026年4月,DeepSeek宣布V4版本永久降价,输入缓存命中后价格再打1折,大幅降低编程成本83%。该举措由DeepSeek研究员陈德里在中国发布,旨在通过技术创新压低AI推理费用,引发行业震动。此次降价惠及学生、小型企业等用户,有望改变AI记忆处理方式,并推动全球市场竞争升级。
|
DeepSeek两天连续两次降价! 输入输出2.5折的基础上,命中缓存的输入折上折再打1折。
划重点了,输入缓存的折扣没有规定时限哦~ DeepSeek研究员陈德里也确认,输入缓存是永久降价,还打上了AGIforEveryone标签。
有学者表示,这将彻底改变人们处理AI记忆的方式。
原来发布时候的“迈入百万上下文普惠时代”是这个意思啊?
那么打折后到底省了多少钱? 只能说,比表面看起来还要更多。 实测编程整体节省83% 首先,Agent编程任务场景下,输入的比例远高于输出。 而且DeepSeek的缓存优化本来就做得好,V4-Pro的输入缓存命中率约95%,V4-Flash约91%。 也就是说,真实花费的绝大部分token,都是按输入(命中缓存)计算的。 在这一点上,V4-Pro每百万token只比V4-Flash贵了0.5分钱。 此前量子位测试消耗约3500万token,花费31.73元。
把数据发给DeepSeek,让他计算一遍,与真实花费相差无几。 但是! 按照打折后的新价格计算,只需要花5.34元了。 整体节省约83%,只花打折前17%的成本,就能获得同样的产出。
实际测试打折后消耗了1300万的V4-Pro token。 缓存命中率稍有提升到了约96%,输出token的占比与打折前测试的也差不多。
实际使用1300万token,花费2.36元,也基本符合计算结果。
价格屠夫回来了 降价引发行业震动,DeepSeek不是第一次干了。 这种商业策略与他们的技术理念高度一致,通过底层架构和算法的持续创新来压低模型推理成本,并将这些成本优势迅速转化为市场竞争力 早在2024年8月,DeepSeek就给V3降价,引发阿里云、字节等大厂更近,引发第一轮token价格战。 R1发布后,更是通过夜间空闲时段额外打折的方法,让价格战进一步升温。 这一次V4在开启价格战,对海外用户的心理冲击力还要更大。 如果按美元标价,小数点后有几位都快数不清楚了。
有网友总结,学生和AI初学者、小型企业都将受益匪浅。
最后,别忘了那行小字。
期待下半年,DeepSeek大规模部署华为算力后,价格还能给大家什么惊喜。 本文来源:量子位 |
IT百科
网友评论
聚超值•精选


