負荷分散と可用性

冗長化 じょうちょうか

フェイルオーバー可用性バックアップ高可用性RAIDクラスタリング
冗長化について教えて

簡単に言うとこんな感じ!

「予備を用意しておくこと」だよ!飛行機のエンジンが2つあるのと同じで、1つ壊れてももう1つで動き続けられる仕組みなんだ。システムが止まらないようにするための「転ばぬ先の杖」ってこと!


冗長化とは

冗長化(じょうちょうか / Redundancy)とは、システムや機器・ネットワークの一部が故障・障害を起こしても、サービスを止めずに継続できるよう、同じ役割を担うコンポーネントを複数用意しておく設計手法のことです。「冗長」という言葉は「余分・無駄」という意味を持ちますが、IT分野では「万が一のために意図的に余分を作る」というポジティブな意味で使われます。

たとえば、重要な業務システムのサーバーが1台しかなければ、そのサーバーが故障した瞬間にすべての業務が止まります。しかし予備のサーバーを用意して自動的に切り替わる仕組みを作っておけば、ユーザーは障害に気づかずにサービスを使い続けられます。これが冗長化の本質です。

システムの可用性(Availability)、つまり「必要なときにちゃんと使えること」を高めるための最も根本的なアプローチであり、銀行・病院・EC サイトなど「止まったら大損害」な場面で特に重要視されます。


冗長化の構造と仕組み

冗長化はどのシステム層にも適用できます。大きく「何を二重化するか」と「どう切り替えるか」の2軸で整理できます。

対象コンポーネント代表的な冗長化手法具体例
サーバー本体クラスタリング・VM 冗長化プライマリ/スタンバイ構成
ストレージ(ディスク)RAIDRAID 1(ミラーリング)など
ネットワーク機器リンクアグリゲーションVRRPスイッチ・ルーターの2台構成
電源二重化電源ユニット(PSU)UPS+商用電源
データセンターマルチサイト・DR サイト東京+大阪拠点での分散
クラウドマルチ AZ・マルチリージョンAWS の複数アベイラビリティゾーン

切り替え方式:アクティブ・スタンバイ vs アクティブ・アクティブ

冗長化した機器をどう動かすかで「2つのモード」があります。

モード動き方メリットデメリット
アクティブ・スタンバイ(1:1 待機)普段は1台が稼働、故障時に予備が起動シンプルで安価切替時に数秒〜数分のダウンが発生しうる
アクティブ・アクティブ(負荷分散)複数台が同時に稼働して処理を分担切替がシームレス+性能向上設計・コストが複雑

覚え方:「冗長化=保険」

冗長化は「システムの保険」と覚えましょう。保険料(追加コスト)を払うことで、事故(障害)が起きたときの損失(停止損害)を最小化するものです。どれだけ掛けるかはリスクとコストのバランス次第。


歴史と背景

  • 1960年代〜 — 宇宙開発(NASA)や軍事システムで、部品の故障が致命的な環境において冗長設計が体系化される
  • 1970〜80年代 — メインフレームの世界で「ホットスタンバイ」構成が登場。大企業の基幹系システムに普及
  • 1988年 — RAID(Redundant Array of Independent Disks)が論文で提唱され、ディスク冗長化が標準的な考え方になる
  • 1990年代 — インターネット商用化に伴い、Web サーバーやルーターの冗長化が急速に普及。VRRP(仮想ルーター冗長化プロトコル)が RFC 化(1998年)
  • 2000年代〜仮想化技術の普及により、ソフトウェアレベルの冗長化(VM ライブマイグレーション等)が低コストで実現可能に
  • 2010年代〜 — クラウドが普及し「マルチ AZ」「マルチリージョン」構成が一般企業でも当たり前になる。可用性 99.99%(フォーナイン) といった数値目標が商談でも登場

可用性(SLA)と冗長化レベルの関係

冗長化のレベルは、どれだけシステムを止めないか=可用性(Availability)の数値で語られます。

可用性年間許容ダウンタイム必要な冗長化レベルの目安
99%(ツーナイン)約87.6時間単一サーバー+定期バックアップ
99.9%(スリーナイン)約8.76時間アクティブ・スタンバイ構成
99.99%(フォーナイン)約52.6分アクティブ・アクティブ+自動フェイルオーバー
99.999%(ファイブナイン)約5.26分マルチサイト+完全自動切替

フォーナイン(99.99%)が多くのビジネスクリティカルなシステムで目標とされる水準です。

冗長化アーキテクチャの比較 アクティブ・スタンバイ サーバーA(稼働中) ● Active 故障時に自動切替 サーバーB(待機中) ○ Standby ✔ シンプル・低コスト △ 切替時に短時間ダウンあり アクティブ・アクティブ サーバーA ● Active サーバーB ● Active ロードバランサー 負荷を均等に振り分け ✔ 切替シームレス・性能向上 △ 設計複雑・コスト増 vs

関連する規格・RFC

規格・RFC番号内容
RFC 5798VRRP v3(Virtual Router Redundancy Protocol)— ルーターの仮想化による冗長化
RFC 7130BFD(Bidirectional Forwarding Detection)— 高速な障害検知プロトコル
ISO/IEC 22301事業継続マネジメントシステム(BCMS)— 冗長化を含む事業継続の国際規格
ANSI/TIA-942データセンターの冗長化レベルを定める Tier 分類(Tier 1〜4)

関連用語