Anthropic 推出三种审计 Agent,用于提升 AI 模型对齐测试的效率,分别负责调查、评估和红队测试。这些 Agent 能够在更大规模上进行并行审计,提高对齐验证效率,并已在 GitHub 上开源代码。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验