热门话题
每日早报
排行榜
AI
科技动态
财经快讯
医疗产业
汽车
专业版

© 2026 NoCode 无码科技（杭州）有限公司浙ICP备17005035号-6 联系我们加入我们产品介绍 MCP 接入

浙公网安备 33010902002965 号浙 B2-20181004

科技新闻，每天 3 分钟

OpenAI 宣布推出 AI Agent 评测基准 PaperBench

OpenAI 宣布推出 AI Agent 评测基准 PaperBench

2025 年 4 月 3 日

OpenAI 推出 PaperBench 基准，用于评估 AI 复现前沿 AI 研究的能力。智能体需复现 20 篇 ICML 2024 论文，最佳模型 Claude 3.5 Sonnet 结合开源框架平均得分为 21.0%，尚未超越人类水平。

OpenAI 宣布推出 AI Agent 评测基准 PaperBench

财联社 / 36Kr / 界面 / 鸟哥笔记

OpenAI 宣布推出 AI Agent 评测基准 PaperBench

品玩

OpenAI 开源 AI Agent 评测基准 PaperBench

开源中国

展开全部报道

话题追踪

2026-07-22

OpenAI 将推出面向企业的新软件 OpenAI Presence

2026-04-22

OpenAI 发布 Images 2，获机构 Arena.ai 测评第一

2026-01-23

OpenAI 拟从客户 AI 辅助研发成果中分成

2025-12-09

OpenAI 称将推出首批 OpenAI 认证课程

2025-10-08

OpenAI 发布战略级 AgentKit 工具套件，推动企业级智能体应用开发

2025-07-18

OpenAI 发布 AI 智能体 ChatGPT Agent

2025-04-17

OpenAI 开源编程智能体 Codex CLI，可在终端运行

2025-04-16

OpenAI 升级《准备框架》，细化 AI 风险分类强化安全措施

2025-04-11

OpenAI 削减了在人工智能模型安全测试上花费的时间和资源

2025-04-03

OpenAI 宣布推出 AI Agent 评测基准 PaperBench

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。

行业标签

订阅

订阅

订阅

订阅

订阅

法律与政策

订阅

订阅

二维码

24 小时

资讯推送

进群体验