データレプリケーション(クラウド間) でーたれぷりけーしょんくらうどかん
データレプリケーションクロスクラウドデータ同期災害復旧整合性
データレプリケーション(クラウド間)について教えて
簡単に言うとこんな感じ!
AWSにあるデータをAzureにもリアルタイムにコピーしておく仕組みのこと。片方のクラウドが落ちてもデータが守られるし、複数の場所から素早くデータを読めるようになるよ!
クラウド間データレプリケーションとは
クラウド間データレプリケーションとは、複数のクラウドプロバイダー間でデータを同期・複製し、可用性の向上・災害対策・グローバルな読み取りパフォーマンスの改善を実現する技術です。
単一クラウドに全データを集中させると、そのクラウドが障害を起こしたとき全サービスが停止します。クラウド間レプリケーションはデータを複数クラウドに保持することで、RPO(目標復旧時点)を最小化し、データ損失リスクを低減します。
レプリケーションの種類
| 種類 | 内容 | RPO | 用途 |
|---|---|---|---|
| 同期レプリケーション | 書き込みは両クラウドに完了してから応答 | 0(データ損失なし) | 金融・医療などミッションクリティカル |
| 非同期レプリケーション | 書き込みは一方に完了後、バックグラウンドで他方へ | 数秒〜数分 | 一般的なビジネスシステム |
| バッチレプリケーション | 一定間隔(1時間・毎日等)でまとめて転送 | 分〜時間 | バックアップ・アーカイブ |
主な実装手段
| 手段 | 適用データ | ツール例 |
|---|---|---|
| DBレプリケーション | リレーショナルDB | PostgreSQL Logical Replication, AWS DMS |
| オブジェクトストレージ同期 | S3/Blob等 | rclone, AWS DataSync, Azure Storage Sync |
| CDC(変更データキャプチャ) | DB変更をリアルタイム転送 | Debezium, AWS DMS CDC mode |
| メッセージキューブリッジ | イベントストリーム | Kafka MirrorMaker 2, Confluent Replicator |
歴史と背景
データレプリケーションの概念自体はディザスタリカバリ(DR)の手法として1990年代から存在します。クラウド時代になって「クラウド間レプリケーション」が注目されたのは、2010年代後半のマルチクラウド採用増加と、2017〜2018年頃の大規模クラウド障害が相次いだことがきっかけです。Kafka MirrorMaker 2のリリース(2019年)やDebeziumのGAなど、クラウドネイティブなCDCツールが整備されたことで技術的なハードルが下がりました。
注意点:転送コスト
関連用語
- マルチリージョンアーキテクチャ — リージョン間のレプリケーション
- マルチクラウド戦略 — データレプリケーションが前提となる設計
- Lake Formation・Purview — データカタログとの連携