機械学習・学習手法

連合学習(フェデレーテッドラーニング) れんごうがくしゅう

連合学習フェデレーテッドラーニングプライバシー分散学習医療AIデータ共有なし
連合学習ってデータを集めなくていいの?

簡単に言うとこんな感じ!

連合学習は「データを一か所に集めずに、各デバイス・組織でバラバラに学習して、モデルの更新情報だけを共有する」仕組みだよ!スマホの入力予測が良くなるのも、個人のデータをサーバーに送らずに学習する連合学習のおかげなんだ。


連合学習とは

連合学習(Federated Learning) とは、各デバイス・組織のデータを中央サーバーに集めずに、それぞれの場所で局所的にモデルを学習させ、モデルの更新(勾配・重み)のみをサーバーに送信して集約する分散機械学習手法です。

2017年にGoogleが提唱し、スマートフォンの入力予測・音声認識の改善に適用しました。データそのものは移動しないため、プライバシー保護とAIの性能向上を両立できます。


連合学習の仕組み

中央サーバー(グローバルモデル)
    ↓ モデル配布
┌─────────────────────────────┐
│ デバイス/組織A │ デバイス/組織B │ デバイス/組織C │
│ ローカル学習   │ ローカル学習   │ ローカル学習   │
└─────────────────────────────┘
    ↓ モデル更新(勾配)のみ送信
中央サーバー(集約・グローバルモデル更新)
    ↓ 繰り返し
精度向上したグローバルモデル

連合学習の活用例

分野活用例
スマートフォンキーボード予測・音声認識の改善(Google Gboard)
医療複数病院のカルテデータを共有せずに疾患予測モデルを学習
金融複数銀行が顧客データを共有せずに詐欺検知モデルを共同改善
製造複数工場の設備データで故障予知モデルを共同学習

歴史と背景

  • 2017年:Googleが「Communication-Efficient Learning of Deep Networks from Decentralized Data」でFederated Learningを提唱
  • 2019年以降:医療・金融分野での応用研究が急増
  • 現在:差分プライバシー・セキュアアグリゲーションとの組み合わせでさらに強固なプライバシー保護が進む

関連用語