Anthropic推出三种审计Agent,用于提升AI模型对齐测试的效率,分别负责调查、评估和红队测试。这些Agent能够在更大规模上进行并行审计,提高对齐验证效率,并已在GitHub上开源代码。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验