クラウドの基本概念

サービスクォータ さーびすくぉーた

サービスクォータ制限リミットAWSクラウド上限申請
サービスクォータについて教えて

簡単に言うとこんな感じ!

クラウドサービスの「使いすぎ防止の上限設定」のこと。デフォルトではEC2インスタンスは何台まで、Lambdaは同時実行何件まで、という制限がある。上限に達したら申請して増やせるけど、知らないと急に止まるから要注意だよ。


サービスクォータとは

サービスクォータ(Service Quota)とは、クラウドサービスで利用できるリソース数・リクエスト数・処理量などの上限値のことです。AWSでは「Service Quotas」、AzureではAzure Subscription Limits、GCPではService Quotasと呼ばれています。

クォータが設けられる理由は主に3つです。①意図しない設定ミスや暴走によるコスト急増の防止、②クラウドインフラ全体の公平なリソース配分、③セキュリティ上の保護(大量リソース作成による攻撃の抑止)。デフォルト値はほとんどのユーザーが問題なく使える水準に設定されていますが、本番システムが成長すると上限に達することがあります。

クォータには**ソフトリミット(申請で増加可能)ハードリミット(技術的・制度的に変更不可)**の2種類があります。事業計画に合わせて事前に引き上げ申請することが推奨されます。


代表的なクォータの例(AWS)

サービスクォータ項目デフォルト値
EC2実行中オンデマンドインスタンスvCPU換算で32〜96
Lambda同時実行数(アカウント全体)1,000
S3バケット数(アカウント)100
VPCリージョンあたりVPC数5
RDSDBインスタンス数40
IAMIAMユーザー数5,000
API GatewayAPIあたり毎秒リクエスト数10,000

クォータ超過時の挙動

サービス種別超過した場合
コンピュート(EC2等)インスタンス起動エラー
APIリクエスト429 Too Many Requests エラー
ストレージ作成エラー
Lambda同時実行スロットリング(実行キューに入る)

歴史と背景

クラウド黎明期(2006〜2010年)、AWSは「制限」をユーザーへの通知なく設けていました。突然サービスが起動しなくなり、調べると上限に達していたというインシデントが多発しました。2019年にAWSが「Service Quotas」コンソールを一元管理する統合ダッシュボードを提供し、可視化・引き上げ申請が簡単になりました。

現在は各クラウドともクォータの透明化と自動化が進んでおり、AWS Service Quotasでは変更履歴の追跡やSlack通知との連携も可能です。


クォータ管理のフロー

クォータ上限引き上げのフロー 現在のクォータ コンソールで確認 使用量を モニタリング 80%超えたら 引き上げ申請 サポートケース 承認(数時間〜数日) 申請前に「なぜ必要か」「いつまでに必要か」を準備しておくとスムーズ AWS: Service Quotas コンソール → 「クォータの引き上げをリクエスト」 Azure: サポートリクエスト → 「サービスと制限のクォータ」 GCP: IAM & 管理 → クォータ → 上限の変更申請

関連する規格・RFC

サービスクォータに特定の規格はありませんが、運用管理として以下が参考になります。

資料内容
AWS Service Quotas ドキュメントAWSの全サービスのクォータ一覧と引き上げ方法
Azure サブスクリプション制限Azureの制限値の公式一覧
GCP クォータとシステム制限GCPのクォータ管理ページ

関連用語