OpenAI 推出两款基于 Apache 2.0 许可证的 gpt-oss 系列开放推理模型,分别为可在 16GB 内存设备运行的 gpt-oss-20b 和需单个 80GB GPU 的 gpt-oss-120b。AMD 与高通宣布旗下硬件支持这些模型。其中,AMD 锐龙 AI Max+ 395 处理器可运行 gpt-oss-120b,输出速率达 30 Token/s。Radeon RX 9070 16GB 显卡在 gpt-oss-20b 上表现优异。高通骁龙平台也支持 gpt-oss-20b 的端侧高效推理。开发者可通过 Hugging Face 和 Ollama 等平台访问这些模型。