苹果发布 FS-DFM 模型 实现长文本生成速度 128 倍提升
10 月 14 日

苹果与俄亥俄州立大学联合发布新型扩散语言模型 FS-DFM,采用三步训练策略,仅 8 次迭代即可完成完整段落生成,较传统模型提速 128 倍。参数规模仅 0.17-1.7B 的 FS-DFM 在文本困惑度和熵值指标上优于 7B 的 Dream 模型与 8B 的 LLaDA 模型。其核心技术减少计算量并保证文本质量。苹果研究团队将公开模型代码与检查点,该成果为大模型轻量化与高效推理提供新路径,有望推动 AI 文本生成技术规模化应用。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟