曦望新一代推理 GPU 芯片启望 S3 发布:单位 Token 推理成本降低 90%
上周二

国产 GPU 厂商曦望发布新一代推理 GPU 芯片启望 S3,这是其近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。启望 S3 是面向大模型推理的定制化 GPGPU 芯片,典型推理场景下整体性价比较上一代提升超 10 倍,支持 FP16 至 FP4 精度切换,显存容量提升 4 倍,在主流大模型推理场景中单位 Token 成本降低约 90%。曦望还发布寰望 SC3-256 超节点方案,联合生态伙伴发起推理成本计划,与浙江大学签署战略合作协议。曦望前身是商汤科技大芯片部门,2025 年芯片交付量已突破万片。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟