Readhub

腾讯混元 AI Infra 核心技术开源：推理吞吐提升 30%

2 月 4 日

腾讯混元 AI Infra 团队推出开源生产级高性能 LLM 推理核心算子库 HPC-Ops，真实场景下，混元模型推理 QPM 提升 30%，DeepSeek 模型 QPM 提升 17%。单算子性能方面，Attention 相比 FlashInfer/FlashAttention 最高提升 2.22 倍，GroupGEMM 相比 DeepGEMM 最高提升 1.88 倍，FusedMoE 相比 TensorRT-LLM 最高提升 1.49 倍。

腾讯混元 AI Infra 核心技术开源：推理吞吐提升 30%

财联社 / 钛媒体 / 格隆汇

腾讯混元 AI Infra 核心技术开源，推理吞吐提升 30%

凤凰科技

腾讯混元 AI Infra 核心技术开源，推理吞吐提升 30%

IT 之家

展开全部报道

话题追踪

2026-02-04

腾讯混元 AI Infra 核心技术开源：推理吞吐提升 30%

2020-04-24

微信开源推理加速工具 TurboTransformers，腾讯开源项目总数破百

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。

行业标签

订阅

订阅

订阅

订阅

订阅

订阅

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

© 2026 NoCode 无码科技（杭州）有限公司浙ICP备17005035号-6 联系我们加入我们产品介绍

浙公网安备 33010902002965 号浙 B2-20181004

科技新闻，每天 3 分钟