字节跳动 VAPO 框架刷新 AIME24 记录，大型语言模型推理能力大幅提升

2025 年 4 月 12 日

字节跳动推出 VAPO 强化学习训练框架，旨在提升大型语言模型在复杂长任务中的推理能力。VAPO 基于 PPO 框架，融入价值训练、长度自适应广义优势估计及协同增效系统等创新技术。优化后的 Qwen2.5-32B 模型在 AIME24 测试中得分从 5 分提升至 60.4 分，超越 DeepSeek R1 和 DAPO 方法。VAPO 在数学推理和长序列任务中表现突出，训练更稳定且高效，多项技术共同作用确保了其优越性能。

字节跳动 VAPO 框架：Qwen2.5-32B 数学推理能力大幅提升，超越 Deepseek-R1

ITBear 科技资讯

字节跳动推出 VAPO 框架：突破 AI 推理极限，Qwen2.5-32B 提分 12 倍超 Deepseek-R1

IT 之家

字节跳动推出 VAPO 框架：突破 AI 推理极限，Qwen2.5-32B 提分 12 倍超 Deepseek-R1

凤凰科技

展开全部报道

2026-04-09

字节跳动推出原生全双工语音大模型 Seeduplex

2026-01-13

腾讯微信 AI 团队推出新型扩散语言模型 WeDLM，提升推理效率

2025-09-09

字节跳动发布 Seedream4.0: 全新多模态图像创作模型

2025-08-21

字节跳动发布开源大语言模型 Seed-OSS

2025-08-14

字节跳动 Seed 开源 VeOmni 框架

2025-08-02

字节跳动发布扩散语言模型 Seed Diffusion Preview

2025-06-25

字节跳动推出 ProtoReasoning 框架：提升大语言模型的逻辑推理能力

2025-05-13

字节视觉-语言多模态大模型 Seed VLM 技术报告首次公开

2025-04-18

字节跳动开源云原生调度框架 Godel-Rescheduler

2025-04-12

字节跳动 VAPO 框架刷新 AIME24 记录，大型语言模型推理能力大幅提升

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。