メタデータ めたでーた
簡単に言うとこんな感じ!
「データについてのデータ」だよ!たとえば写真ファイルそのものが「データ」なら、「いつ・どこで・どのカメラで撮ったか」という情報がメタデータなんだ。本で言えば、本文が「データ」で、奥付や目次・著者名が「メタデータ」ってこと!
メタデータとは
メタデータ(Metadata)とは、「データそのものを説明・記述するためのデータ」のことです。ギリシャ語由来の接頭辞「メタ(meta)」は「〜を超えた」「〜についての」という意味を持ち、直訳すると「データについてのデータ」となります。
たとえば、会社の契約書PDFファイルがあるとします。ファイルの中身(契約の条文)が「データ」だとすれば、「ファイル名・作成日・作成者・ファイルサイズ・最終更新日」といった情報がメタデータです。メタデータがあるからこそ、膨大なファイルの中から目的のものをすばやく検索したり、管理したりできます。
現代のビジネス環境では、社内に蓄積されるデータが爆発的に増えており、「どんなデータがどこにあるか」を把握すること自体が重要な経営課題になっています。メタデータの整備は、データ活用・ガバナンス(管理体制)の土台となる非常に重要な概念です。
メタデータの種類と具体例
メタデータは大きく3つの種類に分けられます。
| 種類 | 説明 | 具体例 |
|---|---|---|
| 記述的メタデータ | コンテンツの内容を説明する | タイトル・著者名・キーワード・概要 |
| 構造的メタデータ | データの構造・形式を示す | ファイル形式・文字コード・データ型・テーブル定義 |
| 管理的メタデータ | データの管理・運用に使う | 作成日・更新日・アクセス権・保存期間 |
身近なメタデータの例
- 画像ファイル(EXIF情報) — 撮影日時・GPS座標・カメラ機種・シャッタースピード
- Word/Excelファイル — 作成者・更新日時・ファイルサイズ・ページ数
- Webページ(HTMLのmetaタグ) — ページタイトル・説明文・OGP情報(SNSでシェアされるサムネイル情報)
- データベースのテーブル — カラム名・データ型・主キー・インデックス情報
- メール — 送信者・受信者・送信日時・件名・MIMEタイプ
「スキーマ」との関係
データベースの世界では、テーブルの構造定義(どんな列があって、どんなデータ型か)をスキーマと呼びます。これも立派なメタデータの一形態です。「スキーマ = データベースの設計図」と覚えておくと、会話についていけます。
歴史と背景
- 1960〜70年代 — コンピュータの普及に伴い、ファイルシステムでファイルの属性情報(作成日・サイズなど)を管理するようになる。これがメタデータ概念の原型
- 1980年代 — リレーショナルデータベースの普及により、「スキーマ(テーブル定義)」という形でデータ構造を記述するメタデータが標準化される
- 1990年代 — インターネットの普及とともにWebコンテンツが爆増。HTMLの
<meta>タグが定義され、検索エンジンがWebページを分類・検索するためにメタデータを活用し始める - 1995年 — ダブリンコア(Dublin Core)と呼ばれる、Web上のコンテンツを記述するためのメタデータ標準が策定される(ISO 15836 として国際標準化)
- 2000年代 — デジタルカメラの普及により、EXIF(Exchangeable Image File Format)が広まり、一般消費者もメタデータを日常的に扱うように
- 2010年代〜 — ビッグデータ・クラウド時代の到来で、データの種類と量が急増。「データカタログ」「データリネージ(データの来歴管理)」など、メタデータ管理ツールの市場が急成長
- 現在 — データガバナンス(データ統制)の観点から、メタデータ管理は経営レベルの課題に。GDPR(EU一般データ保護規則)への対応でも、どんな個人データを持っているかを把握する「データインベントリ」としてメタデータが必須となっている
メタデータの活用場面と関連技術
データカタログ ― 社内データの「図書館目録」
大企業では、社内のデータが様々なシステムにバラバラに存在しています。データカタログとは、「どこにどんなデータがあるか」をメタデータで整理した、いわば社内データの図書館目録です。Collibra・Alation・AWS Glue Data Catalog などのツールが代表例です。
Webとメタデータ:HTMLのmetaタグ
Webページでは <meta> タグを使ってメタデータを記述します。
<head>
<meta name="description" content="メタデータとは何かをわかりやすく解説">
<meta property="og:title" content="メタデータとは">
<meta property="og:image" content="https://example.com/image.png">
</head>
これによってGoogleの検索結果に説明文が表示されたり、LINEやSlackで共有したときにサムネイルが出たりします。
メタデータ管理の位置づけ(データ活用の全体像)
データ(本体)とメタデータの比較
| 比較項目 | データ(本体) | メタデータ |
|---|---|---|
| 内容 | 実際の情報・コンテンツ | データを説明する情報 |
| 例(写真) | 画像の画素データ | 撮影日・場所・カメラ機種 |
| 例(DB) | 顧客の注文履歴レコード | テーブル名・カラム定義・インデックス |
| 例(文書) | 契約書の条文 | ファイル名・作成者・更新日 |
| 主な用途 | 業務処理・分析 | 検索・管理・ガバナンス |
関連する規格・RFC
| 規格・RFC番号 | 内容 |
|---|---|
| RFC 2616 | HTTP/1.1。HTTPヘッダー(Content-Type・Last-Modifiedなど)でメタデータを転送する仕組みを定義 |
| RFC 4287 | Atom Syndication Format。Webフィードにおけるコンテンツとメタデータの記述方式を定義 |
| RFC 5013 | Dublin Core Metadata Element Set。Webリソースを記述するための15要素のメタデータ標準 |
関連用語
- スキーマ — データベースにおけるテーブル構造・定義のこと。構造的メタデータの代表例
- データカタログ — 社内のデータ資産をメタデータで一元管理するツール・仕組み
- データガバナンス — データを組織的に管理・統制するための方針・体制
- データベース — 構造化されたデータを管理するシステム。スキーマというメタデータで構造を定義する
- EXIF — 画像ファイルに埋め込まれるメタデータの標準フォーマット
- HTMLメタタグ — WebページのメタデータをHTMLで記述するための
<meta>タグ - データリネージ — データがどこから来てどう加工されたかの来歴を追跡する仕組み。メタデータの一形態
- ビッグデータ — 大量・多種多様なデータ群。適切なメタデータ管理なしには活用困難