国内头部大模型企业 MiniMax 近日完成近 3 亿美元战略融资,投后估值突破 40 亿美元(约 300 亿人民币),跻身国内大模型“300亿俱乐部”。本轮融资首次引入 上海国资,结合上市公司与交叉基金注资,成为资本寒冬中的标志性事件。公司同步推进赴港上市计划,并以 文本-语音-视频全栈自研 能力构建 AGI 技术护城河。

🧠 核心功能与技术解析
MiniMax 以 多模态融合 为底层架构,通过五大核心技术实现通用智能体(AGI)闭环:
功能模块 | 代表产品 | 技术原理 | 突破性表现 |
---|---|---|---|
文本生成 | M1 开源模型 | MoE架构+线性注意力+RL Scaling | 推理效率提升40%,成本降低30% |
语音合成 | Speech-02 | 高保真情感迁移算法 | 国际语音评测榜单 TOP1 |
视频生成 | Hailuo-02 | 物理引擎驱动动作生成 | 体操等高难度动作生成误差 <5% |
智能体平台 | MiniMax Agent | 多意图决策树框架 | 支持百级任务并发调度 |
跨模态理解 | VL-01 模型 | 语义-视觉对齐增强 | 图文理解准确率 92.7% |
技术亮点:
- Hailuo-02 视频模型:原生支持 1080p 生成,通过 运动轨迹预测算法 实现复杂动作连贯性,生成成本仅为竞品 1/3
- M1 混合架构模型:全球首开 大规模 MoE 架构开源,动态路由机制使模型参数量有效利用率达 90%+
👥 适用人群
- 企业用户:需集成智能客服/数字员工的技术负责人
- 开发者:AGI 应用生态开发者(API 接入/模型微调)
- 创作者:短视频/AIGC 内容生产者
- 投资人:AI 赛道战略投资机构
🚀 工具使用技巧
低成本视频创作
在 海螺 AI 中输入“猫后空翻跳水”等动态指令,系统自动分解为 12 个关键骨骼帧,通过物理引擎补间生成高清视频语音克隆合规方案
使用 Voice Design 工具 时上传 20 秒样本,采用 声纹分离技术 提取音色特征,避免隐私风险智能体任务编排
在 MiniMax Agent 中嵌套 “IF-ELSE 意图识别”指令,例如:IF 用户询问“退款流程” THEN 调用订单数据库 ELSE IF 含“产品故障”关键词 THEN 启动视频指导生成
🌐 访问地址
👉 官网入口:https://www.minimax.cn
✅ 开发者平台:开放 M1 模型权重 / API 文档 / 微调沙箱
🎬 海螺 AI 体验版:移动端支持 15 秒短视频免费生成
技术趋势洞察:
当行业陷入“用户量=模型智能”的误区时,MiniMax 创始人闫俊杰提出 “智能密度”理论 —— 真正提升模型能力的不是数据规模,而是 系统效率与算法迭代速度 的正反馈循环。这种技术定力或许是资本逆势加注的关键原因。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...