腾讯云推DeepSeek-V3.1模型API,支持企业和开发者使用,并整合平台功能。

AI快讯15小时前发布 ai-tab
4 0

一、腾讯云全面接入DeepSeek-V3.1,企业AI开发步入快车道

2025年8月22日,腾讯云宣布深度集成DeepSeek-V3.1大模型,企业和开发者可通过腾讯云API直接调用新版模型服务。此次升级覆盖三大核心平台:

  • API接口服务:提供稳定低延迟的模型调用能力,支持128K超长上下文处理;
  • 智能体开发平台(ADP):内置RAG框架、工作流编排工具,支持快速构建行业专属智能体;
  • TI平台(Tencent Intelligence):支持一键部署私有化模型服务,满足金融、医疗等高合规需求场景。

腾讯云在推理层通过PD分离传输技术NIXL内核优化,实现3.5K输入场景下首Token响应≤2秒,吐字速率≥15 tokens/秒,较开源版本效率提升40%以上。


二、DeepSeek-V3.1核心升级

本次模型迭代聚焦三大突破:

1. 混合推理架构

  • 思考模式(Reasoner):通过思维链压缩技术,复杂问题响应时间缩短30%,输出token数减少20%-50%而性能持平前代;
  • 非思考模式(Chat):采用动态长度控制算法,输出冗余度降低13%,更适合实时交互场景。
    用户可通过API接口deepseek-reasoner/deepseek-chat自由切换模式,或在前端点击“深度思考”按钮实时调整。

2. Agent能力跃迁

  • 编程智能体:在代码修复测评(SWE)中错误定位准确率提升28%,终端复杂任务(Terminal-Bench)完成率突破行业阈值;
  • 搜索智能体:多步推理搜索(browsecomp)任务表现较R1-0528提升37%,支持商用搜索引擎API+网页过滤协同。

3. 企业级工程优化

  • 采用UE8M0 FP8参数精度适配国产芯片,模型体积压缩至685B;
  • 支持strict模式Function Calling,确保API输出严格匹配企业系统Schema。

三、从模型调用到智能体开发的全链路赋能

腾讯云通过三大平台重构企业AI开发流程:

▶ 智能体开发平台(ADP)实战示例

  • 知识库对接:上传合同PDF,自动构建法律条款检索系统,某律所合同审查时间从3小时压缩至8分钟;
  • 工作流编排:拖拽式连接CRM系统API,生成客户投诉自动处理智能体,某零售企业客服人力成本下降60%;
  • 多智能体协作:医疗场景中诊断Agent+病历分析Agent联动,糖尿病并发症预测准确率提升至92%。

▶ TI平台私有化部署

  • 支持企业精调全链路:基于行业数据微调模型,某制造企业设备故障预测模型迭代周期从14天缩短至3天;
  • 提供火山方舟超低延迟方案:20-40ms吐字间隔(TPOT),500万TPM并发保障。

四、高性能与低消耗的平衡之道

DeepSeek-V3.1通过推理效率提升计费策略调整双路径降低企业成本:

  • Token经济性:同任务token消耗较V3-0324减少13%,百万token输入成本低至0.5元(缓存命中);
  • API新计价体系:9月6日起执行阶梯价格,输出统一12元/百万tokens,取消夜间优惠但提供资源扩容保障。
    某互联网公司实测显示:构建客户服务智能体月均成本仅为专有系统的1/60。

五、行业落地

▍法律智能审查
百页跨境合同解析中,V3.1-Think模式精准定位风险条款,错误率下降至人工审核的1/15。

▍工业预测维护
解析千万字设备手册构建知识库,某汽车厂关键设备非计划停机归零,年损失减少2,400万元。

▍C端体验升级

  • 腾讯地图“AI叮当”:生成个性化出行攻略同时推荐周边景点,响应速度提升50%;
  • 腾讯元宝:长文档摘要任务耗时缩短至原1/3,支持百万字小说连贯续写。

六、开发者行动指南

  1. API迁移建议

    • 已有R1用户:通过anthropic_api格式兼容层平滑过渡至V3.1;
    • 新接入用户:调用strict mode Function Calling避免Schema校验异常。
  2. 效能优化技巧

    • 知识库应用:启用ADP的混合检索算法(关键词+向量双路召回),准确率提升34%;
    • 长文本处理:128K上下文场景建议分段异步处理,内存占用降低70%。

🔍 技术决策者洞察:V3.1并非单纯模型升级,而是通过平台化整合将Agent能力转化为企业数字资产。当技术团队面临“自研模型还是调用API”的选择时,腾讯云TI平台提供的精调-部署-监控闭环,可能比从头构建更符合商业本质。


👉 腾讯云DeepSeek-V3.1体验入口

注:本文数据及功能描述基于腾讯云2025年8月22日官方公告,模型能力指标引自DeepSeek技术白皮书。

© 版权声明
trae-字节旗下AI代码助手

相关文章

暂无评论

none
暂无评论...