DeepSeek GitHub 星数超越 OpenAI，仅用时两个月

2025 年 2 月 7 日

DeepSeek 项目在 GitHub 上的 Star 量超过 OpenAI，其 DeepSeek-V3 模型因引入动态注意力机制和混合专家架构而备受瞩目，参数量达 6710 亿，但每 Token 仅激活 370 亿参数，显著降低计算成本。DeepSeek-R1 基于 V3 使用强化学习重构训练，性能大幅提升，无需大量监督微调即可赋予 LLM 强推理能力。DeepSeek 的开源策略为应用创造了大量机会，国内外多个平台已宣布上线 DeepSeek 大模型，英伟达、亚马逊和微软云服务也接入了 DeepSeek R1。随着技术开源，生成式 AI 的发展有望加速。