パイロットライト ぱいろっとらいと
簡単に言うとこんな感じ!
ガスコンロの「種火」みたいなイメージだよ!障害時にすぐ本番環境を立ち上げられるよう、最低限のシステムだけをクラウドで常時動かしておく災害対策の手法なんだ。フル稼働じゃないからコストを抑えつつ、いざとなれば素早く復旧できるってこと!
パイロットライト とは
パイロットライト(Pilot Light) とは、災害復旧(DR: Disaster Recovery)戦略のひとつで、本番環境の「最小限のコア部分だけ」をクラウド上で常時稼働させておく手法です。名前の由来はガスコンロの「種火(パイロットライト)」で、普段は小さな火を燃やし続け、必要なときにすぐ大きな火にできる様子をイメージしています。
通常時は、データベースのレプリケーション(複製)や最小構成のサーバーのみ動かしておきます。障害が発生したときは、あらかじめ用意しておいた設定や自動化スクリプトを使って残りのリソース(Webサーバー・アプリケーションサーバーなど)を素早く起動し、フルスケールの本番環境に切り替えます。
クラウドが普及する以前は、予備のデータセンターを丸ごと用意するのが一般的でしたが、それでは莫大なコストがかかります。パイロットライト戦略ではコストを最小限に抑えながらも数十分〜数時間以内の復旧を実現できるため、中規模のシステムで広く採用されています。
DR戦略の4つのレベル
DRにはコストと復旧速度のトレードオフにより、主に4つの戦略があります。パイロットライトはその中間に位置します。
| 戦略 | 概要 | 復旧目標時間(RTO) | コスト |
|---|---|---|---|
| バックアップ&リストア | データを定期バックアップし、障害時に一から復元 | 数時間〜数日 | 最安 |
| パイロットライト | コア部分のみ常時稼働、障害時にスケールアップ | 数十分〜数時間 | 低〜中 |
| ウォームスタンバイ | 縮小版の本番環境を常時稼働させておく | 数分〜数十分 | 中〜高 |
| マルチサイト(ホットスタンバイ) | 本番環境と同等の環境を常時フル稼働 | ほぼゼロ(秒〜分) | 最高 |
RTO と RPO ってなに?
DR戦略を選ぶときに必ず出てくる2つの指標です。
- RTO(Recovery Time Objective): 「どれだけ早く復旧するか」の目標値。例:「障害から2時間以内に復旧する」
- RPO(Recovery Point Objective): 「どの時点まで遡ってデータを復旧するか」の目標値。例:「最大1時間前の状態まで許容する」
パイロットライトは一般的に RTO: 数十分〜数時間、RPO: 数分〜数十分 を実現できます。
パイロットライト構成の要素
通常時に「常時稼働させておくもの」と「停止させておくもの」を切り分けるのがポイントです。
【通常時】
✅ 常時稼働(種火)
- データベース(レプリカ)
- DNS設定・ロードバランサー
- 最小構成のアプリサーバー(1台)
- 監視・アラートシステム
🔴 停止・最小化(障害時に起動)
- Webサーバー群
- アプリケーションサーバー群
- キャッシュサーバー
- バッチ処理サーバー
歴史と背景
- 2000年代前半: 企業のDR対策は「コールドスタンバイ(バックアップのみ)」か「ホットスタンバイ(フル複製)」の二択が主流。どちらもコストか復旧速度のどちらかを犠牲にしていた
- 2006年: AWSがクラウドサービス(Amazon S3/EC2)を開始。必要なときだけサーバーを起動・停止できる環境が整い始める
- 2010年代: クラウドの従量課金モデルが普及し、「普段は最小限だけ動かして、いざとなれば増やす」という発想が現実的になる
- 2012年頃: AWSがDR戦略のベストプラクティスとして「バックアップ&リストア」「パイロットライト」「ウォームスタンバイ」「マルチサイト」の4段階フレームワークを公式に整理・公表
- 2020年代: マルチクラウド・IaC(Infrastructure as Code)の普及により、パイロットライト環境の自動化・管理がさらに容易になり、中小規模企業でも採用しやすくなった
DR戦略の比較と構成イメージ
4つの戦略を視覚的に比較すると、以下のような関係になります。
実際の発注・選定でどう使う?
システムの重要度によって戦略を使い分けるのが現実的です。
| システムの例 | 推奨DR戦略 | 理由 |
|---|---|---|
| 社内掲示板・情報共有ツール | バックアップ&リストア | 止まっても業務への影響が限定的 |
| 基幹業務システム・ECサイト | パイロットライト | コストと復旧速度のバランスが良い |
| 金融取引・医療システム | マルチサイト | 1秒の停止も許されない |
関連する規格・RFC
| 規格・RFC番号 | 内容 |
|---|---|
| ISO/IEC 27031 | 事業継続のためのICT対応準備に関するガイドライン(DR・BCPの国際標準) |
関連用語
- フェイルオーバー — 障害発生時に予備システムへ自動的に切り替える仕組み
- ディザスタリカバリ — 災害や障害からシステムを復旧させるための計画・手法の総称
- RTO / RPO — 復旧目標時間(RTO)と復旧目標時点(RPO)。DR戦略の基準指標
- ウォームスタンバイ — 縮小版の本番環境を常時稼働させておくDR戦略
- ホットスタンバイ — 本番と同等の環境を常時フル稼働させておくDR戦略
- クラウド — インターネット経由でIT資源を利用する仕組み。パイロットライトの実現基盤
- オートスケーリング — 負荷に応じてサーバー台数を自動的に増減させるクラウド機能
- IaC(Infrastructure as Code) — インフラ構成をコードで管理・自動化する手法。DR自動化に不可欠