クラウドコンピュート

ライブマイグレーション らいぶまいぐれーしょん

ライブマイグレーションvMotionダウンタイムなし無停止移行メンテナンス仮想マシン
ライブマイグレーションについて教えて

簡単に言うとこんな感じ!

稼働中の仮想マシンを止めずに別の物理サーバーに移動させる技術のこと。クラウドのハードウェアメンテナンスや負荷分散のとき、ユーザーが気づかないうちに裏でVMを移動させてくれる魔法みたいな機能だよ。


ライブマイグレーションとは

ライブマイグレーション(Live Migration)とは、稼働中の仮想マシン(VM)をダウンタイムなし(またはごく短時間のサービス中断)で、別の物理ホストサーバーへ移動する技術です。VMwareでは「vMotion」、MicrosoftのHyper-Vでは「Live Migration」と呼ばれています。

クラウドインフラのメンテナンス作業(物理ホストのパッチ適用や障害対応)の際、通常のVMなら停止が必要です。しかしライブマイグレーションを使えば、利用者のVMをサービスを継続したまま別のホストに移動させることができます。これにより、クラウドプロバイダーは利用者への影響を最小化しながらインフラ保守が行えます。


ライブマイグレーションの仕組み

フェーズ内容
1. メモリコピー開始元ホストのVMメモリを宛先ホストにコピー(VMは継続動作)
2. ダーティページ追跡コピー中に更新されたメモリ(ダーティページ)を記録
3. 反復コピー変更分を繰り返しコピー(差分が小さくなるまで)
4. 最終同期残りの差分をコピー。一瞬(数ms〜数百ms)VM停止
5. 切り替え完了宛先ホストでVMが再開。元ホストのVMを削除

通常移行とライブマイグレーションの比較

項目通常移行(Cold Migration)ライブマイグレーション
VMの停止必要(長時間停止)不要(数ms〜数秒の瞬断のみ)
ユーザーへの影響大(サービス停止)ほぼなし
対応用途計画メンテナンス常時可能
技術複雑度

歴史と背景

ライブマイグレーションの研究は1990年代から始まりましたが、実用化のブレークスルーとなったのは、VMwareが2003年に「VMotion」をVMware VirtualCenter 1.0に搭載したことです。2005年頃には企業のデータセンターでの採用が本格化しました。

Google Cloudは2012年頃からクラウドVM向けライブマイグレーションをデフォルト機能として提供し、「クラウドホスト側のメンテナンスで仮想マシンが停止することはほぼない」環境を実現しました。AWSでも2019年のre:Inventで「EC2はインフラメンテナンス時にライブマイグレーションを使用する」ことが発表されています。


ライブマイグレーションのフロー概念図

ライブマイグレーションの流れ 元ホスト VM(稼働中) メモリ・CPU状態 ハードウェアメンテ または負荷分散 メモリコピー(繰り返し) ダーティページ追跡 差分が小さくなるまで 繰り返しコピー ダウンタイム:数ms〜数秒 宛先ホスト VM(継続稼働) 状態を引き継いで再開 サービス継続 ユーザーは気づかない

関連する規格・RFC

規格内容
DMTF CIMクラウド管理情報モデル(マイグレーション含む)
OpenStack Novaオープンソースクラウドのライブマイグレーション実装

関連用語