百度曦灵手语数字人获联合国AI向善奖 | 百度智能云

278 0

? 产品介绍

百度智能云曦灵是百度旗下AI数字人平台，深耕数字人技术7年。2025年7月，其手语数字人解决方案在联合国国际电信联盟（ITU）主办的“人工智能向善全球峰会”中脱颖而出，荣膺全球仅有的“杰出案例奖”。这一奖项认可了曦灵在推动信息无障碍、助力听障群体融入数字社会的标杆价值。目前，百度以9.8%市场份额稳居中国AI数字人行业第一，技术实力与场景落地能力双领先。

? 适用人群

听障人士：全球4.66亿听力残疾人（中国超2054万）；
公共服务机构：医院、银行、车站等需无障碍服务的场所；
媒体与教育机构：电视台、在线教育平台、直播平台；
开发者与企业：寻求高效部署AI手语翻译能力的技术团队。

⚙️ 核心功能与技术解析

以下是曦灵手语数字人的5项核心能力与技术实现原理：

功能	技术原理	应用场景
实时手语直播	基于SMLTA语音识别算法（端到端建模），手机端识别率＞98% → 神经网络精炼翻译模型 → 4D扫描驱动的动作引擎	赛事直播、新闻播报
分钟级视频合成	首创文生3D超写实模型，10分钟生成3D数字人；动作融合算法优化1万+手语动作衔接	课程视频、宣传片制作
双向手语翻译	多模态交互技术+《国家通用手语词典》规范库，实现文字/语音⇄手语的智能互译	线下办事、在线咨询
高精度表情口型	4D扫描训练1200维面部模型，唇形准确度98.5%，自然表情渲染	提升手语可懂度至85%+
全平台快速部署	支持SaaS平台、API组件、一体机（插电即用），小时级完成系统集成	APP/网站/小程序/线下终端

? 技术亮点：
精炼度可控翻译模型：避免逐字翻译，按自然手语逻辑重组语句；
低时延驱动引擎：动作与语音同步误差＜0.5秒，保障实时性。

?️ 工具使用技巧

线下场景快速部署：
- 使用曦灵全离线一体机V3，插电即用，覆盖医院/银行等窗口服务；
- 结合摄像头+麦克风阵列，实现听障用户手语⇄语音的双向转换。
直播场景降本增效：
- 在直播推流软件中接入曦灵手语插件，自动分割画面生成手语主播窗口；
- 支持24小时不间断播报，成本仅为真人手语翻译的15%。
个性化内容生成：
- 上传文稿→AI自动生成带手语主播的视频（支持2D/3D形象），制作效率提升20倍；
- 教育机构可定制“虚拟教师”，为听障学生讲解课程难点。