データベース基本概念

メタデータ めたでーた

データスキーマタグファイル属性データカタログデータマネジメント
メタデータについて教えて

簡単に言うとこんな感じ!

「データについてのデータ」だよ!たとえば写真ファイルそのものが「データ」なら、「いつ・どこで・どのカメラで撮ったか」という情報がメタデータなんだ。本で言えば、本文が「データ」で、奥付や目次・著者名が「メタデータ」ってこと!


メタデータとは

メタデータ(Metadata)とは、「データそのものを説明・記述するためのデータ」のことです。ギリシャ語由来の接頭辞「メタ(meta)」は「〜を超えた」「〜についての」という意味を持ち、直訳すると「データについてのデータ」となります。

たとえば、会社の契約書PDFファイルがあるとします。ファイルの中身(契約の条文)が「データ」だとすれば、「ファイル名・作成日・作成者・ファイルサイズ・最終更新日」といった情報がメタデータです。メタデータがあるからこそ、膨大なファイルの中から目的のものをすばやく検索したり、管理したりできます。

現代のビジネス環境では、社内に蓄積されるデータが爆発的に増えており、「どんなデータがどこにあるか」を把握すること自体が重要な経営課題になっています。メタデータの整備は、データ活用・ガバナンス(管理体制)の土台となる非常に重要な概念です。


メタデータの種類と具体例

メタデータは大きく3つの種類に分けられます。

種類説明具体例
記述的メタデータコンテンツの内容を説明するタイトル・著者名・キーワード・概要
構造的メタデータデータの構造・形式を示すファイル形式・文字コード・データ型テーブル定義
管理的メタデータデータの管理・運用に使う作成日・更新日・アクセス権・保存期間

身近なメタデータの例

  • 画像ファイル(EXIF情報) — 撮影日時・GPS座標・カメラ機種・シャッタースピード
  • Word/Excelファイル — 作成者・更新日時・ファイルサイズ・ページ数
  • Webページ(HTMLのmetaタグ) — ページタイトル・説明文・OGP情報(SNSでシェアされるサムネイル情報)
  • データベースのテーブル — カラム名・データ型・主キーインデックス情報
  • メール — 送信者・受信者・送信日時・件名・MIMEタイプ

「スキーマ」との関係

データベースの世界では、テーブルの構造定義(どんな列があって、どんなデータ型か)をスキーマと呼びます。これも立派なメタデータの一形態です。「スキーマ = データベースの設計図」と覚えておくと、会話についていけます。


歴史と背景

  • 1960〜70年代 — コンピュータの普及に伴い、ファイルシステムでファイルの属性情報(作成日・サイズなど)を管理するようになる。これがメタデータ概念の原型
  • 1980年代リレーショナルデータベースの普及により、「スキーマ(テーブル定義)」という形でデータ構造を記述するメタデータが標準化される
  • 1990年代 — インターネットの普及とともにWebコンテンツが爆増。HTMLの <meta> タグが定義され、検索エンジンがWebページを分類・検索するためにメタデータを活用し始める
  • 1995年ダブリンコア(Dublin Core)と呼ばれる、Web上のコンテンツを記述するためのメタデータ標準が策定される(ISO 15836 として国際標準化)
  • 2000年代 — デジタルカメラの普及により、EXIF(Exchangeable Image File Format)が広まり、一般消費者もメタデータを日常的に扱うように
  • 2010年代〜 — ビッグデータ・クラウド時代の到来で、データの種類と量が急増。「データカタログ」「データリネージ(データの来歴管理)」など、メタデータ管理ツールの市場が急成長
  • 現在データガバナンス(データ統制)の観点から、メタデータ管理は経営レベルの課題に。GDPR(EU一般データ保護規則)への対応でも、どんな個人データを持っているかを把握する「データインベントリ」としてメタデータが必須となっている

メタデータの活用場面と関連技術

データカタログ ― 社内データの「図書館目録」

大企業では、社内のデータが様々なシステムにバラバラに存在しています。データカタログとは、「どこにどんなデータがあるか」をメタデータで整理した、いわば社内データの図書館目録です。Collibra・Alation・AWS Glue Data Catalog などのツールが代表例です。

Webとメタデータ:HTMLのmetaタグ

Webページでは <meta> タグを使ってメタデータを記述します。

<head>
  <meta name="description" content="メタデータとは何かをわかりやすく解説">
  <meta property="og:title" content="メタデータとは">
  <meta property="og:image" content="https://example.com/image.png">
</head>

これによってGoogleの検索結果に説明文が表示されたり、LINEやSlackで共有したときにサムネイルが出たりします。

メタデータ管理の位置づけ(データ活用の全体像)

データ活用における「メタデータ」の位置づけ データカタログ / データガバナンス (社内のデータ資産をメタデータで一元管理する仕組み) 記述的メタデータ タイトル・著者・キーワード 構造的メタデータ スキーマ・データ型・形式 管理的メタデータ 作成日・権限・保存期間 ↑ これらすべてを管理することで「データの見える化」が実現する

データ(本体)とメタデータの比較

比較項目データ(本体)メタデータ
内容実際の情報・コンテンツデータを説明する情報
例(写真)画像の画素データ撮影日・場所・カメラ機種
例(DB)顧客の注文履歴レコードテーブル名・カラム定義・インデックス
例(文書)契約書の条文ファイル名・作成者・更新日
主な用途業務処理・分析検索・管理・ガバナンス

関連する規格・RFC

規格・RFC番号内容
RFC 2616HTTP/1.1。HTTPヘッダー(Content-Type・Last-Modifiedなど)でメタデータを転送する仕組みを定義
RFC 4287Atom Syndication Format。Webフィードにおけるコンテンツとメタデータの記述方式を定義
RFC 5013Dublin Core Metadata Element Set。Webリソースを記述するための15要素のメタデータ標準

関連用語

  • スキーマ — データベースにおけるテーブル構造・定義のこと。構造的メタデータの代表例
  • データカタログ — 社内のデータ資産をメタデータで一元管理するツール・仕組み
  • データガバナンス — データを組織的に管理・統制するための方針・体制
  • データベース — 構造化されたデータを管理するシステム。スキーマというメタデータで構造を定義する
  • EXIF — 画像ファイルに埋め込まれるメタデータの標準フォーマット
  • HTMLメタタグ — WebページのメタデータをHTMLで記述するための <meta> タグ
  • データリネージ — データがどこから来てどう加工されたかの来歴を追跡する仕組み。メタデータの一形態
  • ビッグデータ — 大量・多種多様なデータ群。適切なメタデータ管理なしには活用困難