サービスクォータ さーびすくぉーた
簡単に言うとこんな感じ!
クラウドサービスの「使いすぎ防止の上限設定」のこと。デフォルトではEC2インスタンスは何台まで、Lambdaは同時実行何件まで、という制限がある。上限に達したら申請して増やせるけど、知らないと急に止まるから要注意だよ。
サービスクォータとは
サービスクォータ(Service Quota)とは、クラウドサービスで利用できるリソース数・リクエスト数・処理量などの上限値のことです。AWSでは「Service Quotas」、AzureではAzure Subscription Limits、GCPではService Quotasと呼ばれています。
クォータが設けられる理由は主に3つです。①意図しない設定ミスや暴走によるコスト急増の防止、②クラウドインフラ全体の公平なリソース配分、③セキュリティ上の保護(大量リソース作成による攻撃の抑止)。デフォルト値はほとんどのユーザーが問題なく使える水準に設定されていますが、本番システムが成長すると上限に達することがあります。
クォータには**ソフトリミット(申請で増加可能)とハードリミット(技術的・制度的に変更不可)**の2種類があります。事業計画に合わせて事前に引き上げ申請することが推奨されます。
代表的なクォータの例(AWS)
| サービス | クォータ項目 | デフォルト値 |
|---|---|---|
| EC2 | 実行中オンデマンドインスタンス数 | vCPU換算で32〜96 |
| Lambda | 同時実行数(アカウント全体) | 1,000 |
| S3 | バケット数(アカウント) | 100 |
| VPC | リージョンあたりVPC数 | 5 |
| RDS | DBインスタンス数 | 40 |
| IAM | IAMユーザー数 | 5,000 |
| API Gateway | APIあたり毎秒リクエスト数 | 10,000 |
クォータ超過時の挙動
| サービス種別 | 超過した場合 |
|---|---|
| コンピュート(EC2等) | インスタンス起動エラー |
| APIリクエスト | 429 Too Many Requests エラー |
| ストレージ | 作成エラー |
| Lambda同時実行 | スロットリング(実行キューに入る) |
歴史と背景
クラウド黎明期(2006〜2010年)、AWSは「制限」をユーザーへの通知なく設けていました。突然サービスが起動しなくなり、調べると上限に達していたというインシデントが多発しました。2019年にAWSが「Service Quotas」コンソールを一元管理する統合ダッシュボードを提供し、可視化・引き上げ申請が簡単になりました。
現在は各クラウドともクォータの透明化と自動化が進んでおり、AWS Service Quotasでは変更履歴の追跡やSlack通知との連携も可能です。
クォータ管理のフロー
関連する規格・RFC
サービスクォータに特定の規格はありませんが、運用管理として以下が参考になります。
| 資料 | 内容 |
|---|---|
| AWS Service Quotas ドキュメント | AWSの全サービスのクォータ一覧と引き上げ方法 |
| Azure サブスクリプション制限 | Azureの制限値の公式一覧 |
| GCP クォータとシステム制限 | GCPのクォータ管理ページ |