商汤科技推出“悟能”具身智能平台,增强设备感知交互

AI快讯1周前发布 ai-tab
4 0

🌟 一、产品介绍

商汤科技作为全球领先的计算机视觉与AI企业,于2025年7月27日世界人工智能大会(WAIC)正式推出“悟能”具身智能平台。该平台以自主研发的具身世界模型为核心引擎,依托23000PetaFlops算力的商汤大装置,为机器人、智能设备提供感知-决策-交互一体化的底层支持,推动智能终端从“执行指令”向“主动理解环境”跃迁。

商汤科技推出“悟能”具身智能平台,增强设备感知交互

👥 二、适用人群

  1. 工业自动化工程师:需高精度环境感知的无人搬运、柔性生产线场景;
  2. 服务机器人开发商:需自然交互的导览、陪护、医疗机器人;
  3. 智能家居创新者:需理解家庭空间逻辑的管家型设备;
  4. 医疗康复设备厂商:需动作规划与多模态交互的辅助器械。

⚙️ 三、核心功能与技术原理

功能模块技术实现原理应用场景示例
4D世界构建融合第一/第三视角数据,生成带时空一致性的动态环境模型,支持物理规律仿真厨房物品定位、避障路径规划
多模态交互引擎基于日日新V6.5多模态模型,图像直接参与推理链,提升跨模态指令理解精度PPT讲解、情感陪护对话
视觉导航端侧芯片嵌入轻量化Vision Encoder,实时解析场景深度与物体位姿仓库货物分拣、室内导览
物理规则编辑“开悟”世界模型支持参数化编辑光照、天气、运动轨迹,缩短仿真训练周期自动驾驶模拟测试
端云协同决策云端大模型生成指令,端侧芯片执行低延迟动作控制,响应速度提升5倍紧急避障、机械臂精准抓取

🛠️ 四、工具使用技巧

  1. 多模态指令优化
    👉 输入“进入娱乐室右转,打开院子门”输出:自动分解为“导航-转向-操作”动作链;
    技巧:指令需包含方位介词+动作动词,提升意图识别准确率💡。

  2. 4D环境快速构建
    上传场景视频 → 平台自动生成带物理属性的数字孪生空间 → 编辑参数(如“雨天模式”)→ 导出机器人训练数据集。

  3. 降低推理成本
    选用日日新V6.5 Lite端侧模型,推理效率较前代提升30%,适合算力受限设备。


🔗 五、访问地址

商汤科技“悟能”平台
官网直达:https://www.sensetime.com
WAIC 2025专题页:https://www.waic2025.org


© 版权声明
trae-字节旗下AI代码助手

相关文章

暂无评论

none
暂无评论...