🌟 一、产品介绍
商汤科技作为全球领先的计算机视觉与AI企业,于2025年7月27日世界人工智能大会(WAIC)正式推出“悟能”具身智能平台。该平台以自主研发的具身世界模型为核心引擎,依托23000PetaFlops算力的商汤大装置,为机器人、智能设备提供感知-决策-交互一体化的底层支持,推动智能终端从“执行指令”向“主动理解环境”跃迁。

👥 二、适用人群
- 工业自动化工程师:需高精度环境感知的无人搬运、柔性生产线场景;
- 服务机器人开发商:需自然交互的导览、陪护、医疗机器人;
- 智能家居创新者:需理解家庭空间逻辑的管家型设备;
- 医疗康复设备厂商:需动作规划与多模态交互的辅助器械。
⚙️ 三、核心功能与技术原理
功能模块 | 技术实现原理 | 应用场景示例 |
---|---|---|
4D世界构建 | 融合第一/第三视角数据,生成带时空一致性的动态环境模型,支持物理规律仿真 | 厨房物品定位、避障路径规划 |
多模态交互引擎 | 基于日日新V6.5多模态模型,图像直接参与推理链,提升跨模态指令理解精度 | PPT讲解、情感陪护对话 |
视觉导航 | 端侧芯片嵌入轻量化Vision Encoder,实时解析场景深度与物体位姿 | 仓库货物分拣、室内导览 |
物理规则编辑 | “开悟”世界模型支持参数化编辑光照、天气、运动轨迹,缩短仿真训练周期 | 自动驾驶模拟测试 |
端云协同决策 | 云端大模型生成指令,端侧芯片执行低延迟动作控制,响应速度提升5倍 | 紧急避障、机械臂精准抓取 |
🛠️ 四、工具使用技巧
多模态指令优化:
👉 输入:“进入娱乐室右转,打开院子门” → 输出:自动分解为“导航-转向-操作”动作链;
技巧:指令需包含方位介词+动作动词,提升意图识别准确率💡。4D环境快速构建:
上传场景视频 → 平台自动生成带物理属性的数字孪生空间 → 编辑参数(如“雨天模式”)→ 导出机器人训练数据集。降低推理成本:
选用日日新V6.5 Lite端侧模型,推理效率较前代提升30%,适合算力受限设备。
🔗 五、访问地址
商汤科技“悟能”平台:
官网直达:https://www.sensetime.com
WAIC 2025专题页:https://www.waic2025.org
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...