云天励飞全面聚焦AI推理芯片!2028年单芯片算力剑指数千TOPS,国产算力迎来“加速器”

AI快讯6天前发布 ai-tab
7 0

产品介绍

云天励飞(股票代码:688343)作为国内少数具备算法+芯片全栈能力的AI企业,近日在2025世界人工智能大会(WAIC)上宣布重大战略转型:全面聚焦AI推理芯片研发。公司推出全自研全国产的深界DeepEdge10系列芯片,采用创新“算力积木”架构,并同步展示基于DeepEdge 200芯片的深穹X6000加速卡及多款推理一体机,目标是成为国产AI推理芯片的“核心加速器”。

云天励飞全面聚焦AI推理芯片!2028年单芯片算力剑指数千TOPS,国产算力迎来“加速器”

适用人群

  • AI硬件开发者:需高性价比国产推理芯片的工程师
  • 机器人/智能设备厂商:寻求嵌入式边缘算力解决方案
  • 云计算服务商:布局大模型推理降本增效的运营者
  • 智慧城市建设方:需本地化部署AI算力的政府与企业
  • 国产技术投资人:关注自主可控芯片赛道的资本方

核心功能与技术解析

以下是云天励飞AI推理芯片的核心功能及其技术实现原理:

功能模块技术实现原理代表产品
多模态边缘推理自研NPU Nova 400核心+Transformer专用算子,支持低比特混合量化DeepEdge10C/10 Max
千亿级大模型推理D2D Chiplet异构封装 + C2C Mesh互连,突破内存带宽瓶颈深穹X6000加速卡
动态算力扩展“算力积木”模块化架构,支持4-16颗芯片级联,算力按需组合Edge10C集群方案
全场景模型适配原生适配DeepSeek-R1、通义千问等主流开源模型,集成鸿蒙OS驱动框架DeepSeek推理一体机
超低功耗部署3D近存计算技术,内存混合键合降低数据搬运能耗,能效比提升10倍嵌入式机器人控制模组
国产化安全部署100%国产工艺链,通过广五所自主可控C级认证,支持RISC-V指令集政务安全推理盒
  1. 灵活算力扩展(算力积木架构)
    首创 D2D Chiplet + C2C Mesh 双模互连技术:

    • D2D Chiplet:在单芯片内集成多个计算单元,通过硅中介层实现高速互连
    • C2C Mesh:多芯片间采用PCIe通用接口(NB-Link技术),实现1TB/s级数据传输
      例如将4颗DeepEdge10C芯片级联,可跑满671B MoE大模型,吞吐量达500 tokens/s,功耗不足70W。
  2. 千亿模型边缘部署(近存计算优化)
    采用 3D混合键合内存 技术,将DRAM堆叠于计算单元上方:

    • 内存带宽提升10倍,访存延迟降低至纳秒级
    • 支持FP8/FP4低精度量化,适配Llama2、通义千问等大模型权重压缩
  3. 多场景硬件适配(异构计算框架)
    自研Nova指令集架构,实现:

    • 硬件级Transformer加速:专用Attention算子计算效率提升5倍
    • 动态编译引擎:自动优化模型计算图,适配不同芯片拓扑

工具使用技巧

  1. 快速部署大模型

    • 使用深穹X6000加速卡+NB-Mesh互连组建推理集群,单卡支持256TOPS,8卡扩展可承载万亿参数模型
    • 运行提示:启用动态批处理(Dynamic Batching) 功能,吞吐量提升40%
  2. 低成本边缘设备升级

    • DeepEdge10C模组(15x15mm封装)嵌入智能硬件,支持7B-32B模型本地运行
    • 示例:扫地机器人通过语音指令解析避障路径,响应延迟<200ms
  3. 能效优化策略

    • 深界芯片管理平台开启TDP自适应模式,根据负载动态调节电压频率
    • 实测显示:视频分析场景功耗降低35%

访问地址

  • 官网产品页:www.inspur.com/deepedge-series
  • 技术白皮书下载:www.inspur.com/whitepaper/deepedge2025
  • 采购咨询:sales@inspur.com(企业级)
  • 开发者社区:github.com/Inspur-DeepEdge

💡 行业洞察:随着特斯拉Grok4等对话式AI落地,未来3-5年推理芯片市场规模将反超训练芯片。云天励飞通过“纯血国产”技术路线,正构建从嵌入式设备到智算中心的全域算力网络,让大模型像水电一样渗透生活。


© 版权声明

相关文章

暂无评论

none
暂无评论...