苹果披露 AFM AI 模型细节,文本总结等方面超过 GPT-4
2024 年 7 月 31 日

苹果公司发布了一篇论文,介绍了其最新的Apple Intelligence模型,名为Apple Foundation Model(AFM),包括在设备上运行的AFM-on-device和尚未公开详细信息的AFM-server。模型的训练数据来源多样,包括授权数据、开源数据集及通过Applebot抓取的公开信息,苹果强调用户隐私得到保护,私人数据未包含在训练集中。苹果与多家出版商达成协议,使用他们的新闻档案训练模型,并在GitHub上托管的开源代码上进行训练。AFM模型训练数据集包含6.3万亿个token,使用高质量、可公开获得的数据集,并过滤了敏感信息。苹果使用8192片TPUv4芯片训练AFM-server模型,2048片TPUv5p芯片训练AFM-on-device模型,后者训练速度快近三倍。模型性能方面,AFM在指令遵循和文本总结方面的表现超越了GPT-4,并且有害输出违规率远低于GPT-4。在设备上,AFM的违规率也低于Meta训练的Llama-3-8B模型。在电子邮件、信息和通知汇总方面的满意度也领先于其他模型。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟