商汤“日日新”平台接入小米AI眼镜，实现多场景一体化交互新范式

AI快讯5个月前发布 ai-tab

46 0

一、产品介绍：强强联合的“随身第二大脑”

商汤科技（SenseTime）作为国内AI领域头部企业，其大模型交互平台“日日新”以实时音视频交互和多模态理解能力为核心优势。2025年8月，日日新探索性接入小米首款AI眼镜——这款被定义为“下一代个人智能设备”的硬件，集开放式耳机、第一视角拍摄、AI助手于一体，上市首月销量突破4.7万台。

双方合作聚焦“全双工实时交互”，打破传统一问一答模式，构建类人对话的自然闭环。例如，用户在嘈杂展会中提问展品信息，系统可连续理解上下文并即时反馈，无需重复唤醒。

二、适用人群：谁需要这种颠覆性交互？

人群	典型场景	核心价值
职场人士	会议纪要、客户沟通复盘	语音转文字+重点回溯
跨境旅行者	实时翻译、景点导览	10语种同声传译+OCR翻译
学生/研究者	文献速读、知识点问答	图文解析+多轮追问
科技发烧友	智能家居联动、直播互动	语音控制+第一视角分享
运动爱好者	骑行导航、运动数据记录	免提交互+沉浸式拍摄

三、核心功能：技术原理与场景落地

以下功能按体验优先级排序，融合多模态生成与实时决策能力：

1. 全双工实时对话

技术原理：基于日日新V6.5的毫秒级推理优化（响应延迟＜500ms），结合小米眼镜五麦克风阵列与骨传导降噪，实现“思考即交流”。
场景表现：支持随时打断与追问（如连续追问“这个艺术品的作者是谁？——他还有哪些作品？”），对话流畅度接近真人助手。

2. 跨模态场景理解

技术原理：视觉编码器动态解析画面（如文字/图表/物体），通过检索增强生成（RAG） 调用知识库，实现“所见即所得”问答。
场景表现：识别菜单热量（“小爱同学，这碗面多少卡路里？”）、植物物种、外文翻译，准确率提升40%。

3. 情境化记忆增强

技术原理：音视频记忆向量化存储，通过时空关联检索（如“上周客户提到的预算要求”）调取历史片段。
场景表现：复述会议方案时自动关联客户原始需求，支持生成摘要报告。

4. 复杂环境自适应

技术原理：声网级联方案降低端到端延时至500ms，抗噪算法可过滤6级风速背景音。
场景表现：喧闹街头精准识别“扫码支付”指令，骑行中稳定响应导航需求。

5. 无缝设备协同

技术原理：小米澎湃OS融合设备中心，实现眼镜与手机/智能家居的指令流转。
场景表现：语音控制空调温度（“调到22度”）、同步手机日程提醒、直播视角切换。

四、工具使用技巧：解锁高阶玩法

1. 效率倍增组合拳

✅ 会议场景：双指单击启动录音→结束后自动生成结构化纪要（选择“会议模板”）→关键节点标记回查。

2. 跨语言沟通秘诀

✅ 翻译优化：将外文菜单置于视野中心，说出“翻译这段”，系统优先OCR识别+语义润色（非直译）。

3. 隐私与续航管理

隐私防护：遮挡镜头侧橙色提示灯即禁用拍摄，防误触设计保障安全。
续航提升：关闭持续录像功能，典型场景续航从8.6小时延长至12小时+。

五、访问地址

? 小米AI眼镜购买：https://www.mi.com/prod/xiaomi-ai-glasses | 京东/淘宝官方旗舰店
? 日日新接入指南：商汤官网开发者平台→“小米眼镜”集成SDK
? 官方教程视频：小米眼镜App→“探索”栏目→“多模态交互手册”

? 最后的小思考：当AI从“工具”进化为“第二大脑”，我们是否正站在感知增强的临界点？从识别一杯咖啡的热量，到预判一场商务谈判的走向，技术终将让工具隐形，让人的感知无限延伸。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

trae-字节旗下AI代码助手

相关文章

科大讯飞AI同传：2秒响应辛顿演讲，智能硬件翻译瓶颈突破

科大讯飞AI同传：2秒响应辛顿演讲，智能硬件翻译瓶颈突破

5个月前

西北工大突破极寒作业难题！抗冻机器人新材料实现-50°C自加热巡检

西北工大突破极寒作业难题！抗冻机器人新材料实现-50°C自加热巡检

4个月前

小米浏览器全面升级AI搜索！接入豆包大模型打造极致智能体验

小米浏览器全面升级AI搜索！接入豆包大模型打造极致智能体验

5个月前

英国2027年试点AI政务助手：每年节省450亿英镑的现代化方案

英国2027年试点AI政务助手：每年节省450亿英镑的现代化方案

4个月前

暂无评论

none

暂无评论...