苹果、英伟达等科技公司被曝未经许可使用YouTube视频训练AI

据《连线》杂志报道，包括苹果、英伟达、Anthropic和Salesforce在内的多家科技巨头被发现未经许可使用数千个YouTube视频来训练他们的人工智能模型，引发了严重的版权和伦理争议。

报道披露，这些公司将各种YouTube视频的字幕整合入其AI训练数据集中。受影响的创作者范围广泛，包括知名博主MKBHD、MrBeast、Jacksepticeye，脱口秀演员斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔，以及麻省理工学院、可汗学院、哈佛大学等教育频道，还有华尔街日报、NPR等主流媒体。

图源备注：图片由AI生成，图片授权服务商Midjourney

这些数据实际上是由一个名为Eleuther AI的非营利组织下载并整理的。该组织将这些内容作为他们发布的「The Pile」大数据集的一部分，原本意在为小型开发者和学者提供训练材料。然而，这些数据集随后被各大科技公司所利用。

值得注意的是，苹果等公司并未直接从YouTube下载这些数据，而是使用了Eleuther AI整理的数据集。从技术层面来说，直接违反YouTube使用条款的是Eleuther AI，而非这些科技公司。

这一事件引发了关于AI训练数据来源的合法性和伦理性的讨论。它突显了在快速发展的AI领域中，数据版权和使用许可的重要性，以及现有法律法规在面对这些新兴技术挑战时的不足。同时，这也为创作者、平台和AI公司之间的权益平衡带来了新的思考。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

苹果、英伟达等科技公司被曝未经许可使用YouTube视频训练AI

Mistral新模型Codestral Mamba 速度更快、文本处理长度是GPT-4o两倍

Qwen2-Audio：千问系列的音频多模态模型无需文字即可语音交互

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

Mistral新模型Codestral Mamba 速度更快、文本处理长度是GPT-4o两倍

Qwen2-Audio：千问系列的音频多模态模型 无需文字即可语音交互

科技巨头被曝未经授权用 YouTube 内容训练 AI，苹果、英伟达在列

苹果澄清：YouTube字幕数据未用于Apple Intelligence，OpenELM仅作研究用途

人人都是程序员，英伟达联合推出 StarCoder2 模型

英伟达进军人形机器人领域，推出 Project GR00T 项目

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

Qwen2-Audio：千问系列的音频多模态模型无需文字即可语音交互