Gemini API無料枠の確認方法と、モデルの選び方【実装者向けメモ】

01_効率化

Gemini APIの無料枠はGoogle AI Studioの「レート制限」ページで確認できます。この記事では確認場所・用語の見方・モデルの選び方を実装者目線でまとめます。

確認場所は3つ

  • Google AI Studio → レート制限(上限の確認)
  • Google AI Studio → 使用状況(実際の使用量の確認)
  • Google AI Studio → APIキー(実装時に使う)

気になるところから見ていってください。

レート制限ページの見方

  • RPM・TPM・RPDの意味
  • 「現在使用量/上限」の読み方

API表に表示されている3文字のアルファベット、何のことかわかりませんよね。

ざっくり以下のようです。

  • RPM(Requests Per Minute):1分あたりのリクエスト数
  • TPM(Tokens Per Minute):1分あたりのトークン数
  • RPD(Requests Per Day):1日あたりのリクエスト数

複数回のリクエストを短時間で繰り返す場合はRPM重視

1回あたりの処理が重い場合TPM重視

1リクエストは軽いんだけど、複数のリクエストが何度か来るだろうという場合はRPD重視

といった感じ

レート制限を確認すると ”さらに表示” を選択すると利用できるAPIモデルが一覧として表示されます。

利用できるモデル、それぞれのRPM・TPM・RPD(利用上限)が確認できます。

モデルの選び方(自分の場合)

  • 複数人利用を想定 → RPDに余裕があるモデルを優先
  • Gemini 3.1 Flash Liteを選んだ理由

私の場合は上記のリストからRPD順で並び変えて上位に来たものを上から順に確認します。

モデルは、テキスト出力モデルでないといけないので、それ以外は無視。

自分のプログラム内に実装してみて使えるか確認。使えたら採用!って感じです。

これは時期によっても使えるAPIが違うので、どれが最適化はその時次第ですね。

実際に運用してみてどうか

  • 今のところ自分しか使っていないので余裕
  • 複数人来たときのリスクとして利用上限が懸念

Gemini API の使用状況を確認すると以下のように利用状況が確認できます。

いろいろしてるとエラー出すこともありますが、それは、まず出すことを優先しているわけで、例外処理が不十分なんだろうなと思っています。

直近のエラーは画像でなくPDF読み込ませられるのか確認したときにエラーが出ていましたね。

こういうのは、自分がやった分はわかるんですけど、他の人のエラーは状況込みで報告くれないと修正できない可能性が高いので、どうなるかわかりませんね。

それと、利用者が増えた場合、アクセス上限に達して、利用できなくなるリスクがありますね。

そうなったら有料化したいですけどね。

広告つける程度で、利用者が特に追加の支払いせずに使えるようになるのが理想ですね。

コメント

タイトルとURLをコピーしました