根据美国法院最新解封的文件,Meta员工曾在内部讨论使用未经授权的受版权保护内容来训练其AI模型,包括Llama系列模型。这些文件由原告方提交,涉及诉讼Kadrey v. Meta,该案由作家萨拉·西尔弗曼(Sarah Silverman)和塔-内西·科茨(Ta-Nehisi Coates)等人提起,指控Meta侵犯版权。文件显示,Meta内部员工讨论了购买电子书用于AI训练,并曾考虑使用Libgen等盗版资源。此外,Meta高管还评估过如何规避法律风险,包括删除明显标注为“盗版”或“被窃取”的数据,并在公开场合不披露相关训练数据来源。文件还显示,Meta可能曾使用Reddit数据进行训练,并计划改变过去拒绝使用Quora内容和受版权保护书籍的决定,以获取更多训练数据。目前,该案件仍在审理中,Meta已聘请两位来自保罗·韦斯(Paul Weiss)律所的最高法院诉讼律师加入辩护团队,表明该案对Meta的法律影响重大。Meta尚未对相关报道作出回应。