Vertex AI Gemini Request Quota Usage Graph PromQL
code:promql
sum by (base_model, location)(rate(aiplatform_googleapis_com:quota_generate_content_requests_per_minute_per_project_per_base_model_usage{monitored_resource="aiplatform.googleapis.com/Location"}1m) * 60) / max by (base_model, location)(avg_over_time(aiplatform_googleapis_com:quota_generate_content_requests_per_minute_per_project_per_base_model_limit{monitored_resource="aiplatform.googleapis.com/Location"}1m)) 2024/9/25
PromQL 入門して書いたクエリ一瞬で意味なくなった
プロジェクト単位の quota なくなってリージョン単位で容量を共有する
実質めちゃくちゃ quota アップ
叩きまくってたら使いまくって吹っ飛ぶ
同じリージョンにならず者が居たら予期できないタイミングで quota error になる?
Cloud Monitoring からも見えなくなった?
001 を叩けば変わらず出るはずだけど もう 002 なので
https://gyazo.com/4381cfb4b560b1f4159a190a61d6147a
DSQ でのメトリック
publisher/online_serving/token_count
publisher/online_serving/tokens