华为 + DeepSeek 推理性能创新高，技术报告公布

2025 年 5 月 19 日

华为昇腾在超大规模 MoE 模型推理性能上取得新突破，使用国产芯片全面超越英伟达 Hopper 架构。具体产品包括 CloudMatrix 384 超节点和 Atlas 800I A2 推理服务器，在不同延迟约束下分别实现单卡 Decode 吞吐 1920 Tokens/s 和 808 Tokens/s。华为通过数学优化弥补硬件局限，提升系统能力，并计划全面开源相关技术。此外，华为还将在本周举办技术披露周，分享详细技术报告与博客。

华为 + DeepSeek 推理性能创新高，技术报告公布

IT 之家

华为 + DeepSeek，推理性能创新高！技术报告也公布出来了

凤凰科技 / 量子位 / 智源社区

2026-04-24

华为昇腾超节点系列产品全面支持 DeepSeek V4

2026-04-22

华为 Mate90 或将搭载鸿蒙操作系统 7.0 拥有真正的端侧 AI

2026-04-21

华为超空间内存技术适配计划公布：Mate X7 系列预计 6 月推送

2026-03-17

华为发布针对 AI 推理场景的全新 AI 数据基础设施

2025-11-21

华为发布 Flex:ai AI 容器技术，实现单卡同时承载多个 AI 工作负载

2025-11-19

华为完成 IMT-2020（5G）推进组 5G-A 蜂窝无源物联技术测试

2025-09-29

DeepSeek 新模型上线华为云

2025-09-22

华为、浙大发布 DeepSeek-R1-Safe 大模型

2025-07-30

华为有望实现消费级卫星组网无信号也能提供网络连接

2025-07-26

华为首次线下展出昇腾 384 超节点：业界最大规模 384 卡高速总线互联

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。