可检测 AI模型中“版权内容”，Patronus 推出 CopyrightCatcher API

专门开发大语言模型（LLM）评估工具的 Patronus AI 日前发布了一款名为“CopyrightCatcher”的 API，可用来检测大语言模型的输出结果中是否含有侵权内容，目前相关工具 DEMO 已经放出，感兴趣的小伙伴可以点此访问下载。

▲ 图源 Patronus AI 官方新闻稿

Patronus AI 表示，市面上常见的大语言模型的训练数据中经常含有受到版权保护的内容，因此这些模型很容易输出相应版权内容，从而为部署相关模型的企业带来重大法律风险，因此他们推出了 CopyrightCatcher API，旨在解决相关侵权问题。

据介绍，为了检查大语言模型输出数据是否含有侵权内容，Patronus AI 研究人员从 Goodreads 书籍平台中抽取了一批受到版权保护的文字样本对模型进行对抗性训练，并基于这些书籍建立了 100 则暗示语段。

从报告中得知，相关语段中有 50 则要求模型“生成书籍的第一段”，另外 50 则要求模型生成书籍中的文字片段，研究人员根据上述语段整理汇总而成 CopyrightCatcher API，号称可用来检测大语言模型如何“精确地从原始训练数据复制内容”，同时还能评估模型输出侵权内容的概率。

研究人员使用 OpenAI 的 GPT-4 、Mistral 的 Mixtral-8x7B-Instruct-v0.1、Anthropic 的 Claude-2.1，以及 Meta 的 Llama-2-70b-chat 进行测试，最终发现 GPT-4 最容易生成侵权内容，Claude-2.1 最难生成侵权内容：

GPT-4：44%
Mixtral-8x7B-Instruct-v0.1：22%
Llama-2-70b-chat：10%
Claude-2.1：8%

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

可检测 AI模型中“版权内容”，Patronus 推出 CopyrightCatcher API

微软开始为 Copilot Pro 用户推出创建自定义 GPT 功能

微软 Microsoft Designer 屏蔽特定提示词，避免 Copilot 生成不良价值导向图片

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

微软开始为 Copilot Pro 用户推出创建自定义 GPT 功能

微软 Microsoft Designer 屏蔽特定提示词，避免 Copilot 生成不良价值导向图片

Stable Code Instruct 3B AI 模型亮相：可精准翻译转换编程语言

Meta 发布 Llama 3，号称是最强大的开源大语言模型

90/270 亿参数，谷歌发布 Gemma 2 开源 AI 模型：性能力压同级、单 A100 / H100 GPU 可运行

AI 大语言模型价格战将启？谷歌本月下调 Gemini 1.5 Flash 费用：降幅最高 78.6%

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注