微软发布开源 AI 智能体推理框架 rStar2 – Agent,其参数规模仅为 DeepSeek – R1 的 0.2%,却以 80.6% 的数学推理准确率刷新纪录,在科学推理和工具调用测试中超越现有标杆。该框架有三大技术革新,包括隔离式代码执行架构、GRPO – RoC 算法和高效训练流程。项目已在 GitHub 开源,加速智能体技术产业化落地。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验