🌟 产品定位与公司背景
商汤科技(SenseTime)作为全球领先的AI软件公司,以计算机视觉技术为核心,已从“看懂世界”迈向“动手改造世界”的新阶段。其新成立的具身智能独立团队由两大技术领袖领衔:
- 王晓刚(前绝影智能汽车CEO):主导自动驾驶全栈技术迁移至机器人领域;
- 陶大程(表征学习专家):深耕人机交互与感知决策一体化。
合作方面,商汤已与松应科技达成战略协议,聚焦数据仿真与研发管线优化,目标年内落地500+智能终端。

🎯 适用人群
- 工业自动化工程师:需柔性生产解决方案的技术决策者;
- 机器人开发者:寻求感知-控制一体化框架的研发团队;
- 企业技术采购部门:关注降本增效的制造、物流、医疗行业代表;
- AI算法研究者:探索多模态与大模型落地的学术机构。
⚙️ 核心功能与技术实现
商汤具身智能平台以日日新6.5大模型为底座,深度融合五大能力:
功能模块 | 技术原理 | 行业价值 |
---|---|---|
多模态实时交互 | 基于Omni模型实现语音+视觉流式响应(延迟≤560ms) | 客服机器人自然对话 |
厘米级视觉导航 | SLAM+强化学习动态避障,定位误差<3cm | 仓储物流精准搬运 |
长视频场景解析 | 支持1小时视频结构化分析(V6升级版) | 工业质检全流程监控 |
端到端决策控制 | 迁移UniAD自动驾驶框架,感知-规划一体化模型 | 复杂环境自适应机器人 |
虚实仿真训练 | SenseCore 2.0生成高精度虚拟场景,千机并行训练 | 降低80%实机调试成本 |
💡 技术亮点:推理成本较行业低20-30%,国产芯片(寒武纪/海光)深度适配。
🛠️ 工具使用技巧
- 快速开发工作流:
- 使用商汤开放API接入视觉导航模块 → 减少定位算法开发周期;
- 调用仿真环境生成工具 → 模拟极端工况(如黑暗、强震动)测试机器人鲁棒性。
- 垂直场景优化建议:
- 医疗场景:结合多模态API解析手术视频,自动生成操作报告;
- 工业场景:通过“双机协作”模型(如AI超市采购案例)实现多机器人任务分配。
🔗 访问地址
- 平台发布会:2025世界人工智能大会(WAIC)商汤展区(7月30日-8月2日)
- 技术内测申请:https://www.sensetime.com
- 开发者文档:开放SDK与ROS/GAZEBO兼容接口(预计2025Q3上线)
💎 行业影响与展望
具身智能已被写入2025年《政府工作报告》未来产业名录,而商汤的布局正卡位三大趋势:
- 技术融合:自动驾驶与机器人技术人才双向流动(如智能驾驶专家转向具身智能);
- 资本热潮:京东、美团、蚂蚁等巨头密集投资,半年融资超20亿元;
- 生态竞争:通过“1+X”战略分拆子公司(如元萝卜机器人),构建硬件厂商+开发者的安卓式生态。
🌐 一句话总结:当大模型遇上机械臂,商汤的“视觉基因”正在重新定义生产力——从屏幕里的算法,到真实世界中的行动者。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...