Meta计划本月发布的新一代开源大语言模型Llama 4因多模态训练数据清洗难题已至少延期两次,可能再次推迟。相比Llama 3,新模型在数学推理和代码生成准确率提升37%,但训练需16000块H100 GPU集群,能耗增加2.3倍。若再延期,Meta将错过6月开发者大会展示机会,而Anthropic和谷歌的竞品将在Q3推出重大更新。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验