最近,一份由404Media获取的内部电子表格曝光了Runway公司开发的Gen-3Alpha视频生成器的惊人秘密。这个备受关注的AI视频生成工具,竟然是在大量盗版内容和未经授权的YouTube视频上进行训练的!
Gen-3Alpha在上个月的发布中引起了广泛关注,许多媒体称赞其生成的画面几乎达到真实的效果。当时,Runway只表示Gen-3Alpha是“在视频和图片上共同训练”的,但并未详细说明数据来源。现在,这份电子表格揭示了更多内幕——表格中包含了大量来自Disney、Netflix、Sony等主要YouTube频道的视频链接,还有一些知名盗版内容网站的链接。
虽然404Media无法确认所有列出的资产是否都用于Gen-3Alpha的训练,但根据现有信息,这种情况极有可能存在。这一事件再次暴露了AI公司在生成内容时对版权的不尊重,尤其是在使用大量未授权材料训练AI模型的情况下,这已成为一个长期存在的问题。
据报道,Runway甚至使用了代理服务器来避开YouTube的屏蔽,以便下载所有这些视频。Runway公司去年获得了高达1.41亿美元的融资,投资方包括YouTube母公司Google、Salesforce和芯片制造商NVIDIA,估值达到15亿美元。然而,这种依赖盗版内容的行为可能会让公司面临严峻的法律挑战。
除了Runway,OpenAI也因使用未授权的视频数据而受到批评。今年早些时候,OpenAI的首席技术官在接受采访时表示,不确定公司新开发的视频生成器Sora是否使用了YouTube、Instagram或Facebook上的视频,随后《纽约时报》揭露了OpenAI在训练其AI聊天机器人时违规使用YouTube视频的事实。
YouTube首席执行官Neal Mohan也警告AI公司,使用YouTube视频训练AI模型将是对视频平台使用条款的“明显违反”。
版权问题正成为生成AI技术发展的一个重大障碍,特别是对于那些能够生成完整视频的AI模型。立法者正在重新审视“合理使用”这一法律原则,以应对这一技术带来的挑战。