谷歌在Gemini API中推出隐式缓存新功能,帮助第三方开发者使用最新AI模型时最多节省75%成本,尤其在处理重复性上下文时效果显著。该功能可自动识别并重用相似内容,默认适用于Gemini2.5Pro和2.5Flash模型,当请求与之前某请求前缀相同时可能命中缓存以节约成本。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验