Meta 计划本月发布的新一代开源大语言模型 Llama 4 因多模态训练数据清洗难题已至少延期两次,可能再次推迟。相比 Llama 3,新模型在数学推理和代码生成准确率提升 37%,但训练需 16000 块 H100 GPU 集群,能耗增加 2.3 倍。若再延期,Meta 将错过 6 月开发者大会展示机会,而 Anthropic 和谷歌的竞品将在 Q3 推出重大更新。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验