Anthropic 推出审计 Agent，助力 AI 模型对齐测试

2025 年 7 月 25 日

Anthropic 推出三种审计 Agent，用于提升 AI 模型对齐测试的效率，分别负责调查、评估和红队测试。这些 Agent 能够在更大规模上进行并行审计，提高对齐验证效率，并已在 GitHub 上开源代码。

Anthropic 推出审计 Agent 助力 AI 模型对齐测试

麻省理工科技评论

Anthropic 推出审计 Agent，助力 AI 模型对齐测试

aibase

Anthropic 发布 AI 审计智能体系统，三维架构破解模型对齐验证瓶颈

牛透社

2026-03-10

AI 编程带来代码审查瓶颈，Anthropic 推出 Code Review 工具破局

2026-02-24

Anthropic 推出智能体 AI 工具实现投资银行和人力资源自动化

2026-02-03

AI 律师：Anthropic 进军法律审计领域，对应软件股价跌超 10%

2025-10-09

Anthropic 开源 AI 安全审计工具 Petri，14 款主流模型测试均存安全隐患

2025-09-25

微软引入 OpenAI 竞争对手 Anthropic 为 AI 助手增添模型选择

2025-09-15

Anthropic 发布 LLM Agent 工具编写指南，助力开发者提升效率

2025-08-28

OpenAI 与 Anthropic 进行首次合作测试，推动 AI 安全标准

2025-08-22

Anthropic 将 Claude Code 整合进企业计划提升 AI 开发治理能力

2025-08-06

Anthropic 发布功能更加强大的 AI 模型 Opus 4.1

2025-07-25

Anthropic 推出审计 Agent，助力 AI 模型对齐测试

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。