最近,人工智能公司 Anthropic 宣布将扩大其漏洞奖励计划,旨在测试一种 “下一代 AI 安全缓解系统”。这个新计划主要集中在识别和防御所谓的 “通用越狱攻击”。为了确保技术的安全性,Anthropic 特别关注一些高风险领域,包括化学、生物、放射和核(CBRN)防御,以及网络安全。
在这个漏洞奖励计划中,参与者将有机会提前接触到 Anthropic 最新的安全系统。在正式发布之前,他们的任务就是找出系统中的漏洞或绕过安全措施的方法。这不仅是一个技术挑战,同时也是为了提升 AI 系统的安全性。为了激励更多的安全研究人员参与,Anthropic 表示将为发现新型通用越狱攻击的参与者提供高达15,000美元的奖励。
通过这个扩展的计划,Anthropic 希望能够更好地识别潜在的安全威胁,并及时修复漏洞,从而提升其 AI 产品的安全性和可靠性。这个举措也反映了 AI 行业对安全问题日益增强的关注,特别是在面对快速发展的技术环境时,如何保护用户和社会免受潜在危害显得尤为重要。
Anthropic 不仅在推动技术创新,也在通过这样务实的措施,为 AI 行业的安全防护树立了一个新的标杆。这样的举措预计将吸引更多的研究人员参与,共同为 AI 的安全发展贡献力量。