DeepSeek计划2025年9月6日凌晨调整API价格,并取消夜间优惠。

AI快讯4小时前发布 ai-tab
4 0

一、价格调整

2025年9月6日凌晨起,DeepSeek开放平台的API计费规则将迎来重大变革:

  • 输入成本分化:缓存命中时低至0.5元/百万tokens(原V3为1元),但未命中时飙升至4元/百万tokens(原V3为2元),价差拉大至8倍;
  • 输出统一涨价:从8元涨至12元/百万tokens,涨幅50%;
  • 夜间优惠终结:原每日00:30–08:30的低价时段(V3打5折、R1打2.5折)正式取消。

这意味着高频调用且缓存利用率低的企业,成本可能激增200%以上。杭州某AIGC初创公司技术负责人坦言:“夜间优惠曾是团队控制研发成本的关键,如今需重新评估预算。”

DeepSeek计划2025年9月6日凌晨调整API价格,并取消夜间优惠。

二、V3.1如何支撑价格上浮?

此次调价与新模型DeepSeek-V3.1的发布深度绑定,其能力升级聚焦三大方向:

  1. 混合推理架构
    终结V/R双模型分治,单模型支持思考模式(deepseek-reasoner)非思考模式(deepseek-chat)自由切换。用户点击“深度思考”按钮即可在App或网页端实时切换响应逻辑,API调用也同步支持双模式。

  2. 效率与成本优化

    • 思考加速:V3.1-Think较R1-0528响应时间缩短20%–50%,尤其在代码生成、数学推理等高复杂度任务中提速显著;
    • Token经济性:通过思维链压缩技术,在输出长度减少20%–50%的情况下保持任务表现持平,长期可降低实际token消耗。
  3. Agent能力跃迁
    聚焦编程与搜索智能体场景:

    • 代码修复:在SWE-bench测试中准确率提升至71.6%,超越Claude Opus 4;
    • 复杂搜索:多步推理任务(如browsecomp、HLE测试)性能较R1提升40%以上。

三、开发者与生态的博弈

涨价公告引发开发者社区两极反响:

  • 成本敏感型用户转向替代方案:中小团队开始测试阿里云通义、MiniMax等竞品API,夜间研发密集型项目受影响最大;
  • 高价值场景用户保留率高:某量化基金AI工程师表示:“V3.1在终端命令行任务(Terminal-Bench)的准确率提升30%,即便涨价仍具性价比”。

行业竞争格局同步生变

  • DeepSeek在Artificial Analysis榜单排名跌至第13位,落后于OpenAI、阿里等厂商;
  • 用户流失压力加剧:QuestMobile数据显示,其月活用户从2025Q1的1936万降至Q2的1629万,跌幅超15%。

四、涨价背后的战略逻辑

调价决策背后隐藏两项关键布局:

  1. 国产芯片适配
    V3.1采用UE8M0 FP8精度格式,专为下一代国产AI芯片设计。FP8精度可在国产算力卡(如华为昇腾)上实现推理效率提升,降低对NVIDIA H20的依赖。

  2. 为R2模型储备“弹药”
    接近DeepSeek的业内人士透露,此次收入将用于训练下一代旗舰模型R2:“GPT-5的平庸表现让团队看到机会,但千亿级参数训练需数十万张H20显卡支撑”。


五、控成本、提效率双管齐下

面对涨价,技术团队可采取以下措施:

  • 缓存优化:通过本地缓存层(如Redis)提升命中率,将未命中请求成本压缩80%;
  • 混合调用策略:简单任务用非思考模式(deepseek-chat),复杂分析切至思考模式(deepseek-reasoner)减少重复推理;
  • Anthropic格式兼容:利用新支持的Claude Code框架迁移成本降低50%。

正如某券商TMT分析师所言:“大模型竞争已进入深水区,厂商需在性能与成本间寻找平衡点。V3.1是DeepSeek向Agent时代转型的投名状,而价格杠杆将加速市场洗牌。”


👉 访问DeepSeek-V3.1https://platform.deepseek.com | https://api-docs.deepseek.com

数据来源:DeepSeek公告、Artificial Analysis模型榜单、QuestMobile用户报告(2025年8月)

© 版权声明
trae-字节旗下AI代码助手

相关文章

暂无评论

用户头像
none
暂无评论...