美团发布开源大语言模型 LongCat,该模型采用创新的混合专家(MoE)架构,核心版本 LongCat-Flash 拥有560亿参数,推理速度每秒超过100个标记。通过多阶段训练管道和优化策略,模型在训练稳定性、扩展性及计算效率方面表现优异,并在多项基准测试中展现出与业界领先模型相当的性能,尤其在 MMLU、数学推理和通用推理领域表现突出。美团希望通过开源 LongCat 推动 AI 技术发展,为开发者提供强大工具。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验