データアーキテクチャ

データメッシュ でーためっしゅ

データメッシュデータプロダクトドメイン駆動データガバナンス分散データ管理データオーナーシップ
データメッシュってデータウェアハウスと何が違うの?

簡単に言うとこんな感じ!

データウェアハウスが「全データを一箇所に集める中央集権型」なら、データメッシュは「各部門がそれぞれ自分たちのデータを責任を持って管理・提供する分散型」だよ!中央のデータチームが全部やるとボトルネックになるから、データの「所有権」を各ドメインに分散させるんだ。


データメッシュとは

データメッシュ(Data Mesh) とは、2019年にZhamak Dehghaniが提唱したデータアーキテクチャの考え方で、データの所有権と管理をドメイン(事業部門)ごとに分散させるアプローチです。

従来のデータアーキテクチャは「中央集権型」で、全データを一元管理するデータエンジニアリングチームがボトルネックになりがちでした。データメッシュは、各ドメインがデータプロダクト(利用者が使いやすい形で提供するデータ)を自律的に管理・提供します。


データメッシュの4原則

原則内容
1. ドメイン指向のデータオーナーシップ各ビジネスドメインが自分たちのデータを所有・管理
2. データをプロダクトとして扱うデータを使いやすい形で提供する責任を持つ
3. セルフサービスデータプラットフォーム各ドメインが独立してデータを管理できるインフラ
4. フェデレーテッドガバナンス標準は全社共通で、実装はドメインに委譲

データウェアハウスとデータメッシュの比較

比較軸データウェアハウスデータメッシュ
管理方式中央集権分散・ドメイン
データ所有者中央データチーム各ビジネスドメイン
スケールボトルネックになりやすい水平スケールしやすい
俊敏性遅い速い
ガバナンス一元管理フェデレーテッド

歴史と背景

  • 2019年:Zhamak Dehghaniが「How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh」を発表
  • 2020〜2022年:Thoughtworks Technology Radarでの掲載により大企業に普及

関連用語