アーカイブ あーかいぶ
バックアップ長期保存データ保管圧縮テープストレージコンプライアンス
アーカイブについて教えて
簡単に言うとこんな感じ!
アーカイブは「もう使わないけど捨てられないデータを、安全な倉庫に長期保管すること」だよ!バックアップが「万が一に備えるコピー」なのに対して、アーカイブは「法律や監査のために数年〜数十年レベルで保存しておくデータの保管庫」ってイメージだね。
アーカイブとは
アーカイブ(Archive) とは、日常的な業務では使わなくなったが、法令遵守・監査対応・将来の参照などの目的で長期間にわたって安全に保管しておくデータや記録のことです。語源はギリシャ語の「arkheion(公文書館)」で、国や組織が公的な記録を保存する場所を指していました。
現代のITシステムでは、メールの送受信履歴・契約書の電子データ・財務記録・システムログなど、「今すぐには使わないが、いつか必要になるかもしれない」データをアーカイブとして長期保管します。単に保存するだけでなく、検索・取り出しができる状態で管理することが重要です。
アーカイブはバックアップと混同されがちですが、目的が異なります。バックアップは障害時の復旧を目的とした短〜中期の「予備コピー」ですが、アーカイブは法的義務や監査・証拠保全を目的とした長期の「原本保管」です。この違いを理解することが、データ管理戦略の出発点になります。
アーカイブの目的と特徴
| 観点 | 内容 |
|---|---|
| 主な目的 | 法令遵守(コンプライアンス)・監査対応・訴訟証拠保全・ナレッジ継承 |
| 保存期間 | 数年〜数十年(法律で定められている場合が多い) |
| アクセス頻度 | 低い(普段はほぼ触れない) |
| 変更可否 | 基本的に変更不可(改ざん防止が前提) |
| 検索性 | 必要なときに素早く探し出せることが重要 |
| コスト感 | 低コストの大容量ストレージを使うことが多い |
よく使われる記憶法
「アーカイブ=アクセス少、カッチリ保管、イつでも取り出せる、ブ厚い法的根拠」と覚えると、バックアップとの違いが頭に入りやすいです。
日本の法令による保存義務の例
| データの種類 | 根拠法令 | 保存期間の目安 |
|---|---|---|
| 電子メール(取引関連) | 電子帳簿保存法 | 7年 |
| 財務・会計書類 | 会社法・法人税法 | 7〜10年 |
| 雇用・労働関係書類 | 労働基準法 | 3〜5年 |
| 医療記録 | 医療法 | 5年 |
| 建設工事記録 | 建設業法 | 10年 |
歴史と背景
- 古代〜近代:粘土板・パピルス・紙による公文書保管が「アーカイブ」の原型。図書館・公文書館がその役割を担っていた。
- 1960〜70年代:コンピュータの普及とともに磁気テープによるデータ保管が始まる。テープは今もアーカイブの主流メディアの一つ。
- 1980〜90年代:
tar(Tape ARchive)コマンドがUNIX系OSで広まり、複数ファイルをまとめる「アーカイブ」という概念がIT用語として定着。ZIP・LZH等の圧縮アーカイブ形式も登場。 - 2000年代:SOX法(米国)・個人情報保護法(日本)など各国で情報管理・保存義務が法制化。企業のコンプライアンス対応でメールアーカイブ需要が急増。
- 2010年代:クラウドストレージの普及により、Amazon S3 Glacierなどの低コスト長期保管サービスが登場。オンプレミスからクラウドアーカイブへの移行が加速。
- 2020年代:電子帳簿保存法改正(日本)・GDPRなど規制強化が続き、自動アーカイブ・改ざん防止・監査ログとの連携が標準機能として求められるように。
バックアップとの比較・アーカイブの種類
ビジネスの現場では「バックアップしておけばいいんじゃないの?」という声をよく聞きますが、目的・コスト・管理方法が根本的に異なります。
アーカイブの主な種類
| 種類 | 説明 | 代表的な用途 |
|---|---|---|
| メールアーカイブ | 送受信メールを全件・改ざん不可で長期保存 | 法的証拠・コンプライアンス対応 |
| ファイルアーカイブ | 古いファイルをまとめて圧縮・保管(ZIP・tarなど) | ストレージ節約・バージョン保管 |
| データベースアーカイブ | 古いトランザクションデータを別DBやストレージに移動 | 本番DBの軽量化・履歴参照 |
| ログアーカイブ | システム・操作ログを長期保管 | セキュリティ監査・障害調査 |
| メディアアーカイブ | 映像・音声・画像の原本保管 | 放送局・出版社の資産管理 |
主なアーカイブ用ストレージ
| メディア | 特徴 | 向いているケース |
|---|---|---|
| 磁気テープ(LTO) | 超低コスト・大容量・長寿命(30年以上) | 数十年単位の長期保管 |
| クラウド低コスト層 | S3 Glacier・Azure Archive等。取り出しに時間がかかる | 数年単位の保管・コスト重視 |
| 光ディスク(BD-R) | 書き換え不可・物理的に安定 | 少量データの恒久保存 |
| HDDアーカイブ | 取り出し速度が速い・コストは中程度 | 数年程度でアクセス頻度がある場合 |
関連する規格・RFC
| 規格・RFC番号 | 内容 |
|---|---|
| RFC 5652 | Cryptographic Message Syntax(CMS):アーカイブデータの電子署名・改ざん防止に利用 |
| RFC 4998 | Evidence Record Syntax(ERS):長期アーカイブの証拠記録構文 |
| RFC 6283 | Extensible Markup Language Evidence Record Syntax(XMLERS):XML形式の証拠記録 |