谷歌研究团队利用 GPT-4 击败 AI-Guardian 审核系统

2023 年 8 月 2 日

谷歌研究团队利用 OpenAI 的 GPT-4 成功破解了 AI- Guardian 审核系统，将其精确值降低了 8%。该团队还分享了一系列技术细节，包括如何设计攻击方法和撰写攻击原理来欺骗 AI- Guardian 的防御机制。虽然 AI- Guardian 的开发者指出这种攻击方法将在未来的版本中不再可用，但相关技术文档已发布在 ArXiv 上，有兴趣的小伙伴可以前往了解。

谷歌破解了 AI 审核系统破解者就是谷歌

新浪财经

AI 打败 AI：谷歌研究团队利用 GPT-4 击败 AI-Guardian 审核系统

IT 之家 / 新浪财经

专业版功能

体验专业版特色功能，拓展更丰富、更全面的相关内容。