IT之家 6 月 26 日消息,彭博社最新披露一份 6 月 24 日公示的美国法院文件,代表近 400 家纸媒的出版商联盟指控微软和 OpenAI 公司,称其未经许可抓取网站内容用于训练 AI。
该联盟于本周三向美国纽约南区联邦地区法院提起诉讼,指控微软和 OpenAI 两家公司未经授权抓取新闻内容,用于训练 Copilot 和 ChatGPT 等 AI 背后模型,涉嫌侵犯版权,并触犯《数字千年版权法》。
起诉书称,被告“系统性且秘密地”爬取出版商的网站,并将文章、故事和其他原创作品复制到自己的服务器上,用它们来训练大型语言模型,同时从作品中删除版权管理信息。
原告表示,这些生成式人工智能产品建立在出版商长期投入的内容之上,却为被告带来数十亿美元市场价值,而出版商“1 分钱都没拿到”。原告同时强调,若 AI 公司滥用新闻内容而不承担责任,本轮 AI 热潮可能成为地方新闻业的“丧钟”。
代表原告的新泽西州前总检察长马修 · 普拉特金(民主党)在接受采访时表示,这起诉讼是地方和区域报纸发起的最大规模的法律行动。
OpenAI 发言人 Drew Pusateri 回应称,公司模型推动创新,训练所用数据来自公开可获得的数据,并以合理使用为基础。微软方面未立即回应媒体置评请求。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。