网页编程众测排名:DeepSeek-R1 超越 Claude 4 加冕全球第一
6 月 17 日

DeepSeek-R1 在网页编程众测中超越 Claude Opus 4 成为全球第一,尤其在 LiveCodeBench 上表现接近 OpenAI o3-high。实测显示,DeepSeek-R1-0528 能够快速生成可运行的代码,如太阳系动画、AGI 主题网站等,但在俄罗斯方块小游戏上存在明显 bug。此外,DeepSeek-R1 还被评为当前最佳开源文本模型,在 MIT 许可证下位列总榜第六、开源第一。同时,Kimi-Dev 新模型以 60.4% 的成绩在 SWE-bench Verified 上取得开源 SOTA,编程能力突出。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟