Readhub

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

2025 年 11 月 25 日

AMD 携手 IBM 和 Zyphra，历时 1 年多，成功使用 AMD 硬件训练出首个大型混合专家（MoE）基础模型 ZAYA1。该模型完全基于 AMD 硬件生态系统构建，训练在 IBM 云上进行，使用 AMD Instinct MI300X GPU 等。三方搭建了 128 个节点、共 1024 块 GPU 的训练集群，实际训练性能超 750 PFLOPs，Zyphra 开发了优化训练框架。ZAYA1 预训练用 14 万亿 tokens 数据，采用分阶段课程学习策略。基准测试显示其综合性能与 Qwen3 系列相当，优于 SmolLM3、Phi4 等。其优异性能得益于采用 CCA 注意力机制和改进线性路由两项关键创新。目前公布的是基础模型预览，未来将发布完整后训练版本并分享评测和经验。

AMD 联合 IBM 与 Zyphra 发布全球首款全 AMD 硬件训练 MoE 模型 ZAYA1

牛透社

AMD：Zyphra 在大规模 AI 模型训练方面取得了重大里程碑

格隆汇

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

IT 之家

展开全部报道

话题追踪

2025-12-16

英伟达发布开源多智能体 AI 模型 Nemotron 3，支持跨行业高效协作

2025-11-25

挑战英伟达：首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场

2025-01-13

英伟达发布 6.3 万亿 Token 大型 AI 训练数据库 Nemotron-CC

2025-01-07

英伟达推出世界基础模型，训练机器人和自动驾驶汽车

2024-09-04

马斯克宣布超级 AI 训练集群 Colossus 正式上线拟再增加 10 万张英伟达 GPU

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。

行业标签

订阅

订阅

芯片与半导体

订阅

订阅

订阅

订阅

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

© 2026 NoCode 无码科技（杭州）有限公司浙ICP备17005035号-6 联系我们加入我们产品介绍

浙公网安备 33010902002965 号浙 B2-20181004

科技新闻，每天 3 分钟