​180万深度伪造数据开放!蚂蚁数科联合斯坦福破解AI安全检测难题​

AI快讯15小时前发布 ai-tab
4 0

一、产品介绍

蚂蚁数科联合新加坡科技研究局,在2025年IJCAI会议期间正式开源DDL-Datasets——全球首个覆盖180万条样本的深度伪造定位数据集,涵盖人脸伪造、视频篡改、声音克隆三大高危场景,包含80余种伪造技术,并首次标注了AI造假的画面位置与时间节点。与此同时,斯坦福大学联合谷歌、加州大学伯克利分校开源DeepAction数据集,包含2,600段AI生成的人类动作视频,推动多模态伪造检测技术发展。

技术差异化亮点

  • 时空定位标注:DDL-Datasets在每段伪造内容中标记篡改区域与时间戳,为算法提供可解释性分析依据;
  • 多模态对抗样本:模拟金融场景复杂攻击(如光照变化、背景噪音、多语种口音),覆盖真实世界干扰因素;
  • 跨文化数据设计:纳入不同种族、语言背景样本,解决全球化检测偏差问题。
​180万深度伪造数据开放!蚂蚁数科联合斯坦福破解AI安全检测难题​

二、适用人群

角色核心需求场景
AI安全研究员需大规模高质量数据训练鲁棒模型,解决传统数据集泛化性不足问题;
金融科技工程师防范人脸认证场景的深度伪造攻击,要求99.9%高准确率风控方案;
伦理与政策制定者建立可验证的内容溯源体系,推动生成式AI合规治理。

三、核心功能与技术原理

功能技术原理
多模态覆盖融合视觉(人脸/动作)、听觉(语音克隆)伪造样本,采用跨模态一致性学习框架;
时空定位标注基于像素级篡改检测算法标注伪造区域,结合时间轴分段定位视频篡改节点;
抗干扰鲁棒性斯坦福Human Action CLIPs模型:通过多模态语义嵌入,抵抗分辨率压缩、画面裁剪等篡改手段;
跨文化检测优化纳入莫纳什大学脑电图实验结论,调整数据集种族与语言分布,提升文化差异场景准确率。

四、实战应用技巧

场景操作路径效果验证
金融风控模拟调用DDL-Datasets中“人脸+声音”双模态样本,测试活体检测模型盲点蚂蚁数科实测阻断多起伪造攻击,金融场景准确率98%;
跨文化检测训练使用标注英语/亚洲语种、不同人种样本的子集,优化地域化模型实验显示:相同文化背景检测准确率提升23%;
鲁棒性压力测试加载DeepAction数据集,注入分辨率压缩、运动模糊等噪声验证模型抗干扰能力斯坦福方案在篡改数据下保持94%检测精度。

五、访问地址

  • 蚂蚁数科DDL-Datasetshttps://modelscope.cn/datasets
    ‣ 包含:80万图像伪造样本、60万视频篡改片段、40万声音克隆数据
  • 斯坦福DeepAction数据集https://huggingface.co/datasets
    ‣ 包含:7类AI生成动作视频(行走/奔跑/烹饪等),匹配真实镜头对照集

行业影响:据某东南亚银行实测反馈,接入DDL-Datasets后,其刷脸支付系统的深度伪造拦截率从89%提升至97%,误报率下降40%。随着数据集持续迭代,全球AI安全技术正迈入可解释、可验证的新阶段。

© 版权声明
trae-字节旗下AI代码助手

相关文章

暂无评论

用户头像
none
暂无评论...