华为 + DeepSeek 推理性能创新高,技术报告公布
2025 年 5 月 19 日
华为昇腾在超大规模 MoE 模型推理性能上取得新突破,使用国产芯片全面超越英伟达 Hopper 架构。具体产品包括 CloudMatrix 384 超节点和 Atlas 800I A2 推理服务器,在不同延迟约束下分别实现单卡 Decode 吞吐 1920 Tokens/s 和 808 Tokens/s。华为通过数学优化弥补硬件局限,提升系统能力,并计划全面开源相关技术。此外,华为还将在本周举办技术披露周,分享详细技术报告与博客。
华为 + DeepSeek,推理性能创新高!技术报告也公布出来了
凤凰科技 / 量子位 / 智源社区
2026-04-24
华为昇腾超节点系列产品全面支持 DeepSeek V42026-04-22
华为 Mate90 或将搭载鸿蒙操作系统 7.0 拥有真正的端侧 AI2026-04-21
华为超空间内存技术适配计划公布:Mate X7 系列预计 6 月推送2026-03-17
华为发布针对 AI 推理场景的全新 AI 数据基础设施2025-11-21
华为发布 Flex:ai AI 容器技术,实现单卡同时承载多个 AI 工作负载2025-11-19
华为完成 IMT-2020(5G)推进组 5G-A 蜂窝无源物联技术测试2025-09-29
DeepSeek 新模型上线华为云2025-09-22
华为、浙大发布 DeepSeek-R1-Safe 大模型2025-07-30
华为有望实现消费级卫星组网 无信号也能提供网络连接2025-07-26
华为首次线下展出昇腾 384 超节点:业界最大规模 384 卡高速总线互联查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。