马斯克旗下的人工智能公司xAI推出了Grok-1.5大语言模型,该模型拥有改进的推理能力和128k的上下文长度,尤其在编码和数学任务上表现更佳。Grok-1.5将在𝕏平台上向早期测试人员和现有用户推出。在官方测试中,它在MATH和GSM8k数学基准上分别取得了50.6%和90%的成绩,在HumanEval基准测试中得分为74.1%。该模型构建在自定义的分布式训练框架之上,能够自动检测并剔除有问题的训练节点,同时优化了检查点、数据加载和训练作业重新启动,以减少故障时的停机时间。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验