バックアップ・DR

アーカイブ あーかいぶ

バックアップ長期保存データ保管圧縮テープストレージコンプライアンス
アーカイブについて教えて

簡単に言うとこんな感じ!

アーカイブは「もう使わないけど捨てられないデータを、安全な倉庫に長期保管すること」だよ!バックアップが「万が一に備えるコピー」なのに対して、アーカイブは「法律や監査のために数年〜数十年レベルで保存しておくデータの保管庫」ってイメージだね。


アーカイブとは

アーカイブ(Archive) とは、日常的な業務では使わなくなったが、法令遵守・監査対応・将来の参照などの目的で長期間にわたって安全に保管しておくデータや記録のことです。語源はギリシャ語の「arkheion(公文書館)」で、国や組織が公的な記録を保存する場所を指していました。

現代のITシステムでは、メールの送受信履歴・契約書の電子データ・財務記録・システムログなど、「今すぐには使わないが、いつか必要になるかもしれない」データをアーカイブとして長期保管します。単に保存するだけでなく、検索・取り出しができる状態で管理することが重要です。

アーカイブはバックアップと混同されがちですが、目的が異なります。バックアップは障害時の復旧を目的とした短〜中期の「予備コピー」ですが、アーカイブは法的義務や監査・証拠保全を目的とした長期の「原本保管」です。この違いを理解することが、データ管理戦略の出発点になります。


アーカイブの目的と特徴

観点内容
主な目的法令遵守(コンプライアンス)・監査対応・訴訟証拠保全・ナレッジ継承
保存期間数年〜数十年(法律で定められている場合が多い)
アクセス頻度低い(普段はほぼ触れない)
変更可否基本的に変更不可(改ざん防止が前提)
検索性必要なときに素早く探し出せることが重要
コスト感低コストの大容量ストレージを使うことが多い

よく使われる記憶法

「アーカイブ=クセス少、ッチリ保管、つでも取り出せる、厚い法的根拠」と覚えると、バックアップとの違いが頭に入りやすいです。

日本の法令による保存義務の例

データの種類根拠法令保存期間の目安
電子メール(取引関連)電子帳簿保存法7年
財務・会計書類会社法・法人税法7〜10年
雇用・労働関係書類労働基準法3〜5年
医療記録医療法5年
建設工事記録建設業法10年

歴史と背景

  • 古代〜近代:粘土板・パピルス・紙による公文書保管が「アーカイブ」の原型。図書館・公文書館がその役割を担っていた。
  • 1960〜70年代:コンピュータの普及とともに磁気テープによるデータ保管が始まる。テープは今もアーカイブの主流メディアの一つ。
  • 1980〜90年代tar(Tape ARchive)コマンドがUNIX系OSで広まり、複数ファイルをまとめる「アーカイブ」という概念がIT用語として定着。ZIP・LZH等の圧縮アーカイブ形式も登場。
  • 2000年代:SOX法(米国)・個人情報保護法(日本)など各国で情報管理・保存義務が法制化。企業のコンプライアンス対応でメールアーカイブ需要が急増。
  • 2010年代:クラウドストレージの普及により、Amazon S3 Glacierなどの低コスト長期保管サービスが登場。オンプレミスからクラウドアーカイブへの移行が加速。
  • 2020年代:電子帳簿保存法改正(日本)・GDPRなど規制強化が続き、自動アーカイブ・改ざん防止・監査ログとの連携が標準機能として求められるように。

バックアップとの比較・アーカイブの種類

ビジネスの現場では「バックアップしておけばいいんじゃないの?」という声をよく聞きますが、目的・コスト・管理方法が根本的に異なります。

バックアップ vs アーカイブ バックアップ 🎯 目的:障害時の復旧 📅 期間:数日〜数週間 🔁 頻度:毎日〜毎時間 ✏️ 変更:上書き・世代管理 💰 コスト:中〜高速ストレージ 📂 例:日次バックアップ   スナップショット 「壊れたとき用の予備コピー」 アーカイブ 🎯 目的:法令・監査・証拠保全 📅 期間:数年〜数十年 🔁 頻度:イベント単位・随時 🔒 変更:原則不可(改ざん防止) 💰 コスト:低コスト大容量 📂 例:メールアーカイブ   電子帳簿・契約書 「法律で取っておく原本」

アーカイブの主な種類

種類説明代表的な用途
メールアーカイブ送受信メールを全件・改ざん不可で長期保存法的証拠・コンプライアンス対応
ファイルアーカイブ古いファイルをまとめて圧縮・保管(ZIP・tarなど)ストレージ節約・バージョン保管
データベースアーカイブ古いトランザクションデータを別DBやストレージに移動本番DBの軽量化・履歴参照
ログアーカイブシステム・操作ログを長期保管セキュリティ監査・障害調査
メディアアーカイブ映像・音声・画像の原本保管放送局・出版社の資産管理

主なアーカイブ用ストレージ

メディア特徴向いているケース
磁気テープ(LTO)超低コスト・大容量・長寿命(30年以上)数十年単位の長期保管
クラウド低コスト層S3 Glacier・Azure Archive等。取り出しに時間がかかる数年単位の保管・コスト重視
光ディスク(BD-R)書き換え不可・物理的に安定少量データの恒久保存
HDDアーカイブ取り出し速度が速い・コストは中程度数年程度でアクセス頻度がある場合

関連する規格・RFC

規格・RFC番号内容
RFC 5652Cryptographic Message Syntax(CMS):アーカイブデータの電子署名・改ざん防止に利用
RFC 4998Evidence Record Syntax(ERS):長期アーカイブの証拠記録構文
RFC 6283Extensible Markup Language Evidence Record Syntax(XMLERS):XML形式の証拠記録

関連用語