DeepSeek GitHub 星数超越 OpenAI,仅用时两个月
2 月 7 日

DeepSeek项目在GitHub上的Star量超过OpenAI,其DeepSeek-V3模型因引入动态注意力机制和混合专家架构而备受瞩目,参数量达6710亿,但每Token仅激活370亿参数,显著降低计算成本。DeepSeek-R1基于V3使用强化学习重构训练,性能大幅提升,无需大量监督微调即可赋予LLM强推理能力。DeepSeek的开源策略为应用创造了大量机会,国内外多个平台已宣布上线DeepSeek大模型,英伟达亚马逊微软云服务也接入了DeepSeek R1。随着技术开源,生成式AI的发展有望加速。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟