PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

Geminiの新しい利用制限、Googleがさっそく見直しへ。使い方が見えにくいという不満に対応

キーポイント

何が起きたのか

Googleは、Geminiアプリの利用制限をまた調整しました。
きっかけは、​​「新しい制限に変わったら、思ったより早く上限に当たる」​というユーザーの不満です。

最近のGeminiは、単純に「1日何回まで」という分かりやすい方式ではなく、​どれだけ計算を使ったかで制限が決まる方式に変わっていました。
この「compute-based usage limits」は、ざっくり言うと “重い作業ほど早く上限に近づく” 仕組みです。

たとえば、短い文章を1回返すだけのAIより、

みたいな処理のほうが、当然サーバー側の計算コストが大きいですよね。Googleはそこを反映したかったわけです。

ただ、理屈としては筋が通っていても、​ユーザーからすると「なんか急に使えなくなった」ように見えやすい。ここが今回のポイントだと思います。
AIの利用制限って、裏で何が起きているのか見えにくいので、少しでも説明不足だと不満が出やすいんですよね。

Googleが変えた内容

今回の発表でまず大きいのは、​Gemini 3.1 Proで「1つのプロンプトが使えるクォータ量」に上限を設けることです。

クォータというのは、ざっくり言えば使える量の枠のこと。
つまり、1回の入力であまりに重い処理をさせて、Proモデルの利用枠を一気に食い尽くすのを防ぐ狙いです。

image_0003.jpg

Googleによると、特に大きなファイルを扱う複雑なプロンプトが、想像以上に利用制限を削っていたようです。
これはかなり納得感があります。便利な機能ほど、使う側は「ちょっと試しただけ」と思いがちですが、裏ではかなりの計算資源を食っていることがあるんですよね。

エラーになった分はカウントしない

地味だけど、かなり大事なのがここです。

Googleは、​失敗したリクエストは制限に含めないと明言しました。
つまり、リクエストがエラーになっても、ユーザーの枠は減らないということです。

Googleの言い方も少し印象的で、

システムのミスはGoogle側の責任であって、ユーザーの責任ではない
というスタンスをはっきり示しています。

これは当たり前に見えて、実はかなり重要です。
AIサービスって、たまに失敗したのに「はい、消費しました」と扱われると、ものすごく損した気分になるんですよね。そういう不満を抑える意味でも、今回の修正は良い方向だと思います。

Deep Researchはもっと分かりやすくする予定

Deep Researchのような重い処理は、当然ながらより多くの計算量を使うそうです。
そのためGoogleは、今後利用状況の内訳をもっと細かく見せたり、通知を増やしたりする予定だとしています。

現状の gemini.google.com/usage のダッシュボードは、正直かなり大まか。
「あとどれくらいでどの機能が使えなくなるのか」がぱっと見で分かりにくいので、ここは改善してほしいところです。

個人的には、AIサービスの快適さって「性能」だけではなく、​残り量の見えやすさでかなり変わると思っています。
スマホのバッテリー残量が見えないと不安になるのと同じで、AIも使える量が見えないと、気持ちよく使えません。

image_0004.png

Flash-Liteは無料扱いに

今回の変更で面白いのが、​Gemini 3.1 Flash-Liteのプロンプトは無料で、クォータを消費しないことです。

Flash-Liteは、ざっくり言うと軽量で安い、日常用途向けのモデル
高性能モデルほどではないけれど、軽い作業には十分使えるタイプです。

Googleとしては、重いモデルを使う場面と軽いモデルを使う場面を分けてほしいのかもしれません。
これは合理的ですが、ユーザー目線では「結局どのモデルを選べば損しないの?」となりやすいので、もう少し案内が親切だとありがたいですね。

モデル選択は覚えられるように

Googleはさらに、​一度選んだモデルは次回以降のセッションでも保持されると案内しています。
手動で変えない限り、その選択が続く仕組みです。

ただし、上限に達した場合は自動で軽いモデルに切り替わることがあります。
このあたりは便利でもあり、ちょっとややこしくもあります。

AIサービスは「裏で自動調整する」機能が増えるほど快適になりますが、そのぶんユーザーが何を使っているのか見えづらくなることも多いです。
このバランス、かなり難しいんですよね。

Omni動画生成の問題も修正

もうひとつ重要なのが、​Omni動画生成で一部の人が1〜2本作っただけでクォータを大量に消費していたバグの修正です。

image_0005.png

Googleによると、​Google AI UltraユーザーはOmni生成回数が2倍になりました。
さらに今後も、Omniをより多く使えるように改善していくとしています。

動画生成はとにかく重いので、制限が厳しくなりやすいのは理解できます。
でも、「試しに数本作っただけで終わる」のはさすがにストレスが大きいので、今回の修正はかなり現実的だと思います。

まとめ

今回のGoogleの対応は、要するに**“計算量ベースの制限は続けるけど、使いにくさは減らします”**という話です。

AIは便利になるほど、裏側のコスト管理が難しくなります。
その結果、制限が厳しすぎると不満が出るし、緩すぎるとサービス運営が成り立たない。
Geminiの今回の調整は、その綱引きの真ん中を探している感じですね。

個人的には、Googleが「失敗は課金しない」「何にどれだけ使ったかをもっと見せる」と言っているのはかなり良い方向だと思います。
AIサービスは、賢さだけでなく納得感が大事。Geminiはそこをようやく本気で整え始めた、という印象です。


参考: Google adjusts Gemini’s new usage limits in response to complaints

同じ著者の記事