AI监管组织“AI Disclosures Project”最新报告指出,OpenAI的GPT-4o模型可能在未获授权的情况下,使用了O’Reilly Media旗下的付费书籍进行训练。报告基于一种检测AI训练数据中是否包含特定文本的“DE-COP”方法,发现GPT-4o对O’Reilly图书的识别能力远高于旧版模型,如GPT-3.5 Turbo。O’Reilly Media并未与OpenAI签署许可协议。尽管报告作者承认无法完全排除用户自行粘贴文本的可能性,但此发现仍在OpenAI面临多个版权诉讼的背景下引发关注。OpenAI暂无回应。