DeepSeek-R1在网页编程众测中超越Claude Opus 4成为全球第一,尤其在LiveCodeBench上表现接近OpenAI o3-high。实测显示,DeepSeek-R1-0528能够快速生成可运行的代码,如太阳系动画、AGI主题网站等,但在俄罗斯方块小游戏上存在明显bug。此外,DeepSeek-R1还被评为当前最佳开源文本模型,在MIT许可证下位列总榜第六、开源第一。同时,Kimi-Dev新模型以60.4%的成绩在SWE-bench Verified上取得开源SOTA,编程能力突出。