マルチクラウド・ハイブリッド

データレプリケーション(クラウド間) でーたれぷりけーしょんくらうどかん

データレプリケーションクロスクラウドデータ同期災害復旧整合性
データレプリケーション(クラウド間)について教えて

簡単に言うとこんな感じ!

AWSにあるデータをAzureにもリアルタイムにコピーしておく仕組みのこと。片方のクラウドが落ちてもデータが守られるし、複数の場所から素早くデータを読めるようになるよ!


クラウド間データレプリケーションとは

クラウド間データレプリケーションとは、複数のクラウドプロバイダー間でデータを同期・複製し、可用性の向上・災害対策・グローバルな読み取りパフォーマンスの改善を実現する技術です。

単一クラウドに全データを集中させると、そのクラウドが障害を起こしたとき全サービスが停止します。クラウド間レプリケーションはデータを複数クラウドに保持することで、RPO(目標復旧時点)を最小化し、データ損失リスクを低減します。


レプリケーションの種類

種類内容RPO用途
同期レプリケーション書き込みは両クラウドに完了してから応答0(データ損失なし)金融・医療などミッションクリティカル
非同期レプリケーション書き込みは一方に完了後、バックグラウンドで他方へ数秒〜数分一般的なビジネスシステム
バッチレプリケーション一定間隔(1時間・毎日等)でまとめて転送分〜時間バックアップアーカイブ

主な実装手段

手段適用データツール例
DBレプリケーションリレーショナルDBPostgreSQL Logical Replication, AWS DMS
オブジェクトストレージ同期S3/Blob等rclone, AWS DataSync, Azure Storage Sync
CDC(変更データキャプチャ)DB変更をリアルタイム転送Debezium, AWS DMS CDC mode
メッセージキューブリッジイベントストリームKafka MirrorMaker 2, Confluent Replicator

歴史と背景

データレプリケーションの概念自体はディザスタリカバリ(DR)の手法として1990年代から存在します。クラウド時代になって「クラウド間レプリケーション」が注目されたのは、2010年代後半のマルチクラウド採用増加と、2017〜2018年頃の大規模クラウド障害が相次いだことがきっかけです。Kafka MirrorMaker 2のリリース(2019年)やDebeziumのGAなど、クラウドネイティブなCDCツールが整備されたことで技術的なハードルが下がりました。


注意点:転送コスト

⚠️ エグレス(外部転送)コストに注意 クラウドからデータを「外」へ転送する際には転送量に応じた費用が発生します。 大量データを常時クラウド間でレプリケーションすると、 予想外に高額なコストが発生することがあります。 転送量・頻度・データサイズを事前に試算し、必要なデータのみを対象にすることが重要です。

関連用語