谷歌研究团队利用OpenAI的GPT-4成功破解了AI- Guardian审核系统,将其精确值降低了8%。该团队还分享了一系列技术细节,包括如何设计攻击方法和撰写攻击原理来欺骗AI- Guardian的防御机制。虽然AI- Guardian的开发者指出这种攻击方法将在未来的版本中不再可用,但相关技术文档已发布在ArXiv上,有兴趣的小伙伴可以前往了解。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验