谷歌在 Gemini API 中推出隐式缓存新功能,帮助第三方开发者使用最新 AI 模型时最多节省 75% 成本,尤其在处理重复性上下文时效果显著。该功能可自动识别并重用相似内容,默认适用于 Gemini2.5Pro 和 2.5Flash 模型,当请求与之前某请求前缀相同时可能命中缓存以节约成本。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验