苹果公司发布iPhone AI的首个预览版及相关论文,披露其人工智能模型是在谷歌的TPU上训练的,并介绍了为支持Apple Intelligence功能而开发的基础语言模型。苹果在8192块TPU v4芯片上训练云侧AFM,使用4096的序列长度和4096个序列的批量大小,进行了6.3万亿token训练。端侧AFM在2048块TPU v5p芯片上进行训练。这可能表明大型科技公司在人工智能训练方面可能正在寻找英伟达图形处理单元的替代品。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验