法院文件曝光Meta内部讨论使用受版权保护内容训练AI

2025年02月22日来源：TechCrunch分类：人工智能

根据美国法院最新解封的文件，Meta员工曾在内部讨论使用未经授权的受版权保护内容来训练其AI模型，包括Llama系列模型。这些文件由原告方提交，涉及诉讼Kadrey v. Meta，该案由作家萨拉·西尔弗曼（Sarah Silverman）和塔-内西·科茨（Ta-Nehisi Coates）等人提起，指控Meta侵犯版权。文件显示，Meta内部员工讨论了购买电子书用于AI训练，并曾考虑使用Libgen等盗版资源。此外，Meta高管还评估过如何规避法律风险，包括删除明显标注为“盗版”或“被窃取”的数据，并在公开场合不披露相关训练数据来源。文件还显示，Meta可能曾使用Reddit数据进行训练，并计划改变过去拒绝使用Quora内容和受版权保护书籍的决定，以获取更多训练数据。目前，该案件仍在审理中，Meta已聘请两位来自保罗·韦斯（Paul Weiss）律所的最高法院诉讼律师加入辩护团队，表明该案对Meta的法律影响重大。Meta尚未对相关报道作出回应。

支持率<5%