【重要】Gemini APIの課金バグにより過大請求が確認されています
2025年9月1日、8月に公開されたGemini APIの「Gemini 2.5 Flash Native Image Generation」に基づくAPI利用料金が、通常の5倍にも登る過剰請求が行われているという報告が流れています(Gemini 2.5 Proでも同様のケースが有るという未確認情報も)。
あってはならない問題が発生しており、中には一千万円を超える金額にも登っており、決済されてしまうと企業の運転資金の枯渇から支払い不能、ブラックリスト登録などハレーションが起きる可能性がありますので、クレジットカード決済の場合には、支払い停止措置などが必要になります。(月頭の1日がGCPの決済日なので、既に結果は出てるハズ)。
目次
問題の報告
今回の懸案事項に対するツイート
国内国外でまだ一部の人からのみ報告が出ています。過剰請求されているのに気がついていないというケースも有り得るでしょう。仮に決済されても後日返金されるらしいですが、そもそも過剰請求自体があってはならないことです。この辺の温度感にズレがあると、今後のGoogle Cloud推進上大きな悔恨になる可能性が。
海外掲示板Redditに於いても同様の報告が上がってきているようです。Google GeminiのDeveloper Forumでもこちらやこちらそしてこちらでも、同様の報告が上がっています。
.@googleaidevs @GeminiApp @googlecloud A bug in your token accounting is billing us ~5× more on Gemini pro 2.5 API. Every call now shows ~50 k “thought_tokens” but nothing has changed on our side—latency and output length are flat—so the only explanation is that input_tokens are…
— Lisha (@lishali88) April 28, 2025
本日Google⚠️Geminiの課金システムのバグ⚠️により1000万円を超える過剰請求の決済が行われました。
当社は事前に、事実を把握できていたため、会社の口座とつながってるデビットカードを外していたため、決済は履行されませんでしたため難を逃れることができました。… pic.twitter.com/XEl1kMlYTL
— とーます|AIコーチの開発&共有プラットフォーム (@Xroid_Lab) September 2, 2025
8月23日から起きていた
公式フォーラムのスレッドを見てみると投稿日が10日前つまり、8月23日の時点から発生していたことがわかります。スクリーンショットとして貼られてる課金のグラフがまさに8/23のその日の分のグラフだけ突出して計上されてます。
また、この日はnano bananaのリリース日付近でもあり、API利用者に対して発生している問題になっています(Geminiアプリではありません)。しかし該当のAPIを使っておらず、Gemini 2.5 Proのテキストモデルだけを使っていたにも関わらず、Native Image Generationにて課金されてるという人まで。故に画像出力使ってないから無関係というわけではないのがこちらのブログを見てみるとわかります。
日本国内では月初めの1日に請求書が送られてきて初めて知るパターンもあるでしょう。
対するGoogleの応対は掲示板では様々ですが返金対応が非常に遅いということでプロジェクトをシャットダウンさせたという方もおり、結果、現在に至るまで再開出来ていない為、ビジネスへの影響も出ているとのこと。このような渋い対応を初動で行った結果、フォーラムで炎上気味になってるのが現在です。
※実際には8/23よりも前から発生していたという報告もあり、現在公式からの正確な発表等がありません。本件はニュースにもなっていないのが不思議。
Google担当者からの情報
Logan KilpatrickというGoogle担当者が該当スレッドに登場し、今回の件に関して投稿をしています。
- 請求は無効となり、返金されます。利用者は特に何もする必要はないとのこと。
- ステータスダッシュボードに本件について掲載した(1行書きだけれど)。
8月27日時点で誤課金は停止したとのことですが、3日前の投稿で28日に課金されてることが確認される投稿もあり、信用してそのままにするのはちょっと危険な気がします。
そもそも課金システムのバグなのか?Gemini API自体が抱えているバグなのか?後者のケースを疑って投稿してる方もいる状態です。
不穏な報告
前述でも「Gemini APIの抱えているバグなのでは?」という報告と同様の事例も公式フォーラムに投稿されています。内容は以下のような内容です。
- Gemini 2.5 APIを利用してテキストでのリクエスト(画像生成ではない)を送った際に、過剰で無意味な出力トークン消費が発生することがある。
- その無駄なトークン消費が無限ループに陥り、トークンを消費し尽くすまで出続ける
- 人によっては合計で10時間もループし続けたという報告が上がっている。
- 結果としてその分だけ課金されつづけ、今回の誤課金につながってるのでは?という疑念。
- その証拠のリクエストに対するレスポンスのログデータが貼り付けられていました。
- もう一つの可能性として、通常のテキストリクエストなのに何故か画像生成の画像出力と誤分類され高額な単価で請求の可能性。画像生成や動画生成を使っていいないのに、APIリクエストログに残ってるのはこれが理由かも)。
- 対するGoogleの課金サポート担当の対応は見当違いの回答と応対で解決に繋がっていない現状。
- 別スレッドでは、APIキーも無効化し課金アカウントも削除したのに復活してきたので、プロジェクトそのものをシャットダウンするという決断をした人もいる。
仮にこれが事実であるとなると、実務じゃ怖くて使えない。その上引き落としキャンセルはされず、課金の返金という対応では、資金繰りの観点からは一時的であったとしても、資金を失いダウンタイム中の逸失利益によりビジネスにダメージが発生する可能性を問うている質問者もいます。
なお、Gemini APIは入力が1,048,576トークン、出力が65,536トークンで、この出力トークン上限いっぱいまで無意味なデータが一回のリクエストで吐き出されるということですね。
確認をする方法
これはGemini API Keyに紐づいてるGooge Cloud側の課金アカウントのレポートで確認出来ます。
- Google Cloud Consoleをクリックする
- プロジェクトではなく課金アカウント単位ですので、左サイドバーから課金をクリックする
- 該当の請求アカウントをクリックする
- レポートをクリックする
- 誤請求の可能性があるのは、8月の利用料分なのでサービスタブの「使用日による期間」を2025/8/1〜2025/9/30に指定して適用をクリックする
- グラフとともに利用料金が出てくるので、突出したおかしな数値が無いか?をよく確認する
但しこの課金アカウントのグラフはリアルタイムではないため、反映するのに48時間は掛かります。
図:課金アカウントで確認が必要
対処法
一時対処
もし、あきらかにオカシイ数値があった場合には、x.comのとーます氏の言うように直ちに処置が必要です。
- Gemini APIキーについてはすべて削除を行い外しておく(可能であれば無効化して削除も)
- GASのようにプロジェクトで連結してる場合は、連結先プロジェクトにおけるAPIとサービスにおいて、「Vertex AI API」および「Gemini for Google Cloud API」、「Generative Language API」については無効化しておく
- クレジットカードの場合、速やかにクレジットカード会社に連絡をして決済履行しないように相談をする
- Google Cloudのサポートに対して過剰決済されてる旨の報告と経緯、経過を伝え、可能であればスクリーンショットを取っておく
- 決済できなかったことによりアカウント停止という二次災害の可能性もあり得るのでサポートに対してその旨も確認し、証憑を残しておきましょう。
Google直契約の場合、こういった問題に対して自身で全部対処が必要になるため、法人の場合には直接契約は行わずに「パートナー企業」経由で契約をし、パートナー企業側で確認ややり取りをしてもらうほうがベターでしょう。何よりもカード決済ではなく、課金代行であるため請求書払いにすることも可能です。
※もちろん、APIキーが漏洩して第三者に使い倒されてるというケースも有り得ますので、APIキーについては常日頃厳格な管理が必要です。
※なお、APIと課金のバグであるため、API無効化を行っても課金され続けてるという報告もあります。そもそも対象のAPIを使っていないのに計上されたという話もあるため、常に課金アカウントの動きはウォッチしておきましょう。
アラート設定を入れておく
それなりに業務で活用している人や、異常課金を恐れる人でやっていない人はいないと思いますが、必ず課金アカウントに対して「課金アラート」設定はしておきましょう。第一報で異常値検知をすることが可能です。
- Google Cloudの課金ページを開く
- 対象の課金アカウントをクリックする
- 左サイドバーの予算とアラートをクリックする
- 上部にある「予算を作成」をクリック
- 名前を適当に入力し、期間は月別で良いでしょう。
- 基本全部のプロジェクトでオッケーです。
- 次へをクリックする
- 指定額として、ここに毎月平均で使ってる金額や設定予算額を入れておく(これが閾値になります)。
- 終了をクリックする
これで、月内の金額が閾値近辺や到達するとアラートとしてメールが管理者に飛んできます。
図:アラートは必ず設定が必要です。
図:Billing Alertのメール
何故か存在しないハードリミット
課金アラートはあっても、何故かGoogle CloudのAPI利用にはハードリミット、つまり物理的なAPI利用制限を課す機能が存在しません。また、課金情報を取得するAPIも何故か存在しません。Redditでもこの疑問について提示されており、Cloud Runで自分で仕組みを作れるという語るユーザーもいますが、わざわざそんな仕組みを作らないと行けないと言うのは疑問。
レート制限はあるものの、金額的な閾値をもってして1ヶ月の間でリミッターを設けるということが出来ません。



