智谱发布新模型GLM-4.5并开源：参数效率翻倍，API价格低至Claude的1/10

60 0

? 介绍

智谱AI于2025年7月28日发布新一代旗舰模型GLM-4.5，全面开源并登陆Hugging Face与ModelScope平台。该模型专为智能体（Agent）应用设计，以3550亿参数MoE架构实现推理、代码、智能体能力原生融合，综合性能斩获全球第三、开源模型第一。更震撼的是，其API价格低至输入0.8元/百万tokens、输出2元/百万tokens，仅为Claude的1/10，生成速度突破100 tokens/秒。

? 适用人群

人群类型	典型应用场景
AI开发者	低成本构建Agent、全栈应用开发
技术团队	企业级AI工具链集成、私有化部署
数据科学家	复杂任务自动化、多模态任务处理
技术决策者	评估高性价比AI基础设施
高校/研究机构	开源模型二次研发、AGI技术探索

? 核心功能与技术解析

1. 原生智能体支持

专为Agent任务设计，支持任务规划→工具调用→执行反馈全流程。通过8万亿token领域精调+强化学习，在真实代码评测中胜率超80%（对比Qwen3-Coder）。

2. 全栈开发能力

原生支持前后端联动开发，实测可生成交互式网站、游戏、BI系统。例如：

动态3D粒子银河（Three.js）
仿B站弹幕系统（实时数据库交互）
广告投放仪表盘（Tailwind CSS+Chart.js）

3. MoE架构增效

模型版本	总参数	激活参数	能效比
GLM-4.5	3550亿	320亿	DeepSeek-R1的2倍
GLM-4.5-Air	1060亿	120亿	Kimi-K2的3倍

通过动态专家网络调度，相同任务下能耗降低40%。

4. 双模式推理引擎

模式	响应速度	适用场景
思考模式	中低速	复杂工具调用、数学证明
非思考模式	≤100 tokens/秒	即时对话、内容生成

支持think→ultrathink分级指令控制计算资源。

5. 成本革命性突破

对比主流模型API价格（单位：元/百万tokens）：

服务商	输入成本	输出成本
GLM-4.5	0.8	2
DeepSeek-R1	1	16
Claude 4	21.5	107.4

企业级应用成本直降90%。

? 工具使用技巧

高效开发四步法：

环境配置

# 配置Claude Code兼容接口
export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic
export ANTHROPIC_AUTH_TOKEN="你的API Key"

任务分级提示词
- 简单UI生成：非思考模式+基础描述
- 复杂逻辑："think harder" + 输入输出示例
全栈项目生成
使用Full-Stack模式自动构建前后端联调环境，支持实时预览与代码下载。
性能调优
对长文本任务启用上下文分段计价（128K上下文输入价1.6元/百万tokens）。

? 访问地址

平台类型	链接	特色
API开放平台	https://bigmodel.cn	新用户赠2000万tokens
开源社区	https://huggingface.co/datasets/zai-org/glm-4.5	MIT协议商用授权
在线体验	https://chatglm.cn	满血版GLM-4.5免费试用
开发框架	https://chat.z.ai	支持项目级Workspace托管