コンテキストキャッシュ
コンテキスト キャッシュ ガイド | Google AI for Developers | Google for Developers
Gemini API のコンテキスト キャッシュ機能は、入力トークン数が多い繰り返しコンテンツを含むリクエストのコストを削減するように設計されています。
大きな
コンテキストウィンドウ
にキャッシュ済のトークンを使って、節約できるのだとか
自分の使い方だとそこまで大規模な使い方をすることはないから、そういう機能があるとだけメモしておく