在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,把长文本处理速度提升了11倍,性能不仅没降反而还超越了传统的全注意力模型。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验