​谷歌 AI 推出 Stax:帮助开发者根据自定义标准评估大语言模型
9 月 3 日

谷歌 AI 推出实验性评估工具 Stax,帮助开发者根据自定义标准测试和分析大语言模型。Stax 提供「快速比较」和「项目与数据集」功能,支持结构化评估流程,提升测试效率与一致性。工具内置多种评估器,涵盖流畅性、基础性和安全性,同时支持自定义评估标准,满足不同应用场景需求。通过分析仪表板,开发者可直观比较模型表现,更好地评估模型在实际应用中的适用性。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟