Meta因用盗版成人片训AI，被两公司起诉索赔3.59亿美元。

132 0

一、天价索赔背后的数据盗用链条

2025年8月，加州法院受理了一起震动科技行业的诉讼：成人影片制作商Strike 3和Counterlife Media指控Meta在2018年至2025年间，系统性盗用2396部受版权保护的成人影片，用于训练其视频生成模型“Meta Movie Gen”及语言大模型LLaMA。诉状直指Meta通过盗版网站获取内容，并利用BitTorrent技术实现批量下载与同步传播，索赔金额高达3.59亿美元。

值得关注的是，BitTorrent协议的特性使Meta的行为构成双重侵权——下载过程中自动向其他用户分发盗版内容。诉方强调，Meta本可通过合法授权规避风险，却选择调整技术设置以掩盖数据来源。例如，工程师曾内部警告“用公司设备下载种子存在法律风险”，但公司仍推进该方案。

二、Meta的“盗版数据依赖症”

这并非Meta首次因训练数据陷入争议。2025年3月披露的法庭文件显示，Meta曾通过盗版平台LibGen和Z-Library下载81.7TB书籍数据，其中35.7TB被证实为侵权内容。内部邮件显示，员工明知LibGen存在“中高法律风险”，但为加速模型开发，高层仍批准使用。

更值得玩味的是其矛盾立场：在同期作家团体诉讼中，Meta以“合理使用”原则成功抗辩，主张AI训练属于对原作的“转化性使用”。然而法官明确指出，若数据来源非法（如盗版平台），合理使用辩护自动失效。此次成人影片案的争议焦点正在于此：当数据获取本身涉嫌违法，技术创新的正当性如何立足？

三、法律争议的核心冲突

1. 版权法能否适配AI训练场景？
Meta沿用“转化性使用”理论，声称模型输出不复制原始表达，而是学习语言规律后生成新内容。2025年6月，加州法院在作家诉讼案中认可该观点，认为AI训练类似于“人类阅读后创作”。

2. 盗版数据彻底颠覆抗辩逻辑
成人影片案的原告直击要害：即便AI输出具有转换性，盗版获取数据的行为本身已构成直接侵权。BitTorrent下载过程中的传播行为更违反《数字千年版权法》（DMCA），最高可面临单部作品15万美元的故意侵权罚金。

3. 成人内容的特殊法律地位
成人影片的版权保护在美国司法实践中更具刚性。该类作品通常不适用“合理使用”例外，且传播盗版内容可能触发联邦刑法关于淫秽物品分发的条款，进一步放大Meta的法律风险。

四、技术伦理的“双重塌陷”

案件暴露Meta在数据伦理与儿童安全领域的系统性失守：

数据治理缺失：内部政策默许使用盗版库，员工曾建议“删除版权标识©”规避审查；
安全机制失效：2025年8月同期曝光的文件显示，Meta AI聊天机器人被允许与未成年人进行“浪漫角色扮演”，甚至生成虚假医疗信息和种族歧视内容。

美国参议员乔什·霍利对此尖锐质疑：“当企业将商业利益置于伦理底线之上，谁来为技术滥用兜底？”

五、行业重构的临界点

1. 版权清算机制亟待建立
诉讼可能推动“数据授权池”模式发展。参考音乐行业的集体管理制度，AI公司可通过统一平台支付版权费获取训练数据，但需解决两个难题：

海量作品权属确认的效率瓶颈
成人内容等特殊类别的授权壁垒

2. 技术自救方案加速落地
包括差分隐私（Differential Privacy）与合成数据（Synthetic Data）在内的合规路径受到追捧。微软近期推出隐私保护框架，通过添加噪声数据阻断模型对单一作品的记忆复制；初创公司Anthropic则建立授权图书库，避免触碰盗版雷区。

3. 全球监管框架收紧
德州检察机关已启动对AI公司的“欺骗性商业行为”调查；欧盟拟要求企业披露完整训练数据溯源记录。若Meta败诉，或将开启“盗版数据导致天价赔偿”的判例时代，迫使行业重建数据合规体系。

创新不能逾越法律红线

当Meta工程师在内部邮件中写下“用公司电脑下载种子是否不妥”时，答案早已不言自明。此案揭示的不仅是3.59亿美元索赔，更是生成式AI狂飙突进中必须直面的核心矛盾：缺乏伦理约束的技术进化，终将付出法律与信誉的双重代价。未来AI竞争的关键指标，或许不再是参数规模，而是训练数据的“清白指数”。

行业观察：Meta近年数据版权争议事件表
时间涉案内容数据规模法律进展
2025年3月盗版书籍 81.7TB 法院认定侵权成立
2025年6月作家作品侵权未公开合理使用抗辩成功
2025年8月 成人影片盗版 2396部 诉讼进行中

时间	涉案内容	数据规模	法律进展
2025年3月	盗版书籍	81.7TB	法院认定侵权成立
2025年6月	作家作品侵权	未公开	合理使用抗辩成功
2025年8月	成人影片盗版	2396部	诉讼进行中