DeepSeek小更新,多步推理表现提高43%
8 月 20 日

DeepSeek近日升级了其模型至V3.1版本,提升了推理能力、上下文处理能力和多语言支持。该版本模型拥有5600亿参数,处理复杂任务的能力增强,多步推理表现提高43%。上下文长度达128k,可处理10万到13万汉字,相当于一部完整的中长篇小说。模型减少产生不实信息的情况,提高了信息准确性,并能处理超过100种语言。然而,备受关注的DeepSeek R2版本因训练中遇到的问题,其发布被推迟。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟