DeepSeek 小更新，多步推理表现提高 43%

2025 年 8 月 20 日

DeepSeek 近日升级了其模型至 V3.1 版本，提升了推理能力、上下文处理能力和多语言支持。该版本模型拥有 5600 亿参数，处理复杂任务的能力增强，多步推理表现提高 43%。上下文长度达 128k，可处理 10 万到 13 万汉字，相当于一部完整的中长篇小说。模型减少产生不实信息的情况，提高了信息准确性，并能处理超过 100 种语言。然而，备受关注的 DeepSeek R2 版本因训练中遇到的问题，其发布被推迟。