一、价格调整
2025年9月6日凌晨起,DeepSeek开放平台的API计费规则将迎来重大变革:
- 输入成本分化:缓存命中时低至0.5元/百万tokens(原V3为1元),但未命中时飙升至4元/百万tokens(原V3为2元),价差拉大至8倍;
- 输出统一涨价:从8元涨至12元/百万tokens,涨幅50%;
- 夜间优惠终结:原每日00:30–08:30的低价时段(V3打5折、R1打2.5折)正式取消。
这意味着高频调用且缓存利用率低的企业,成本可能激增200%以上。杭州某AIGC初创公司技术负责人坦言:“夜间优惠曾是团队控制研发成本的关键,如今需重新评估预算。”

二、V3.1如何支撑价格上浮?
此次调价与新模型DeepSeek-V3.1的发布深度绑定,其能力升级聚焦三大方向:
混合推理架构
终结V/R双模型分治,单模型支持思考模式(deepseek-reasoner)与非思考模式(deepseek-chat)自由切换。用户点击“深度思考”按钮即可在App或网页端实时切换响应逻辑,API调用也同步支持双模式。效率与成本优化
- 思考加速:V3.1-Think较R1-0528响应时间缩短20%–50%,尤其在代码生成、数学推理等高复杂度任务中提速显著;
- Token经济性:通过思维链压缩技术,在输出长度减少20%–50%的情况下保持任务表现持平,长期可降低实际token消耗。
Agent能力跃迁
聚焦编程与搜索智能体场景:- 代码修复:在SWE-bench测试中准确率提升至71.6%,超越Claude Opus 4;
- 复杂搜索:多步推理任务(如browsecomp、HLE测试)性能较R1提升40%以上。
三、开发者与生态的博弈
涨价公告引发开发者社区两极反响:
- 成本敏感型用户转向替代方案:中小团队开始测试阿里云通义、MiniMax等竞品API,夜间研发密集型项目受影响最大;
- 高价值场景用户保留率高:某量化基金AI工程师表示:“V3.1在终端命令行任务(Terminal-Bench)的准确率提升30%,即便涨价仍具性价比”。
行业竞争格局同步生变:
- DeepSeek在Artificial Analysis榜单排名跌至第13位,落后于OpenAI、阿里等厂商;
- 用户流失压力加剧:QuestMobile数据显示,其月活用户从2025Q1的1936万降至Q2的1629万,跌幅超15%。
四、涨价背后的战略逻辑
调价决策背后隐藏两项关键布局:
国产芯片适配
V3.1采用UE8M0 FP8精度格式,专为下一代国产AI芯片设计。FP8精度可在国产算力卡(如华为昇腾)上实现推理效率提升,降低对NVIDIA H20的依赖。为R2模型储备“弹药”
接近DeepSeek的业内人士透露,此次收入将用于训练下一代旗舰模型R2:“GPT-5的平庸表现让团队看到机会,但千亿级参数训练需数十万张H20显卡支撑”。
五、控成本、提效率双管齐下
面对涨价,技术团队可采取以下措施:
- 缓存优化:通过本地缓存层(如Redis)提升命中率,将未命中请求成本压缩80%;
- 混合调用策略:简单任务用非思考模式(deepseek-chat),复杂分析切至思考模式(deepseek-reasoner)减少重复推理;
- Anthropic格式兼容:利用新支持的Claude Code框架迁移成本降低50%。
正如某券商TMT分析师所言:“大模型竞争已进入深水区,厂商需在性能与成本间寻找平衡点。V3.1是DeepSeek向Agent时代转型的投名状,而价格杠杆将加速市场洗牌。”
👉 访问DeepSeek-V3.1:https://platform.deepseek.com | https://api-docs.deepseek.com
数据来源:DeepSeek公告、Artificial Analysis模型榜单、QuestMobile用户报告(2025年8月)
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...