DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。该模型参数量为 3B,开源地址为 https://huggingface.co/deepseek-ai/DeepSeek-OCR 和 https://github.com/deepseek-ai/DeepSeek-OCR. 它由核心编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-A570M 组成,实验显示在不同压缩比下有较好的 OCR 精度,在 OmniDocBench 测试中表现优于其他模型,在实际生产中可在单块 A100-40G 显卡上每天生成超 20 万页大语言模型 / 视觉语言模型训练数据.