連合学習(フェデレーテッドラーニング) れんごうがくしゅう
連合学習フェデレーテッドラーニングプライバシー分散学習医療AIデータ共有なし
連合学習ってデータを集めなくていいの?
連合学習とは
連合学習(Federated Learning) とは、各デバイス・組織のデータを中央サーバーに集めずに、それぞれの場所で局所的にモデルを学習させ、モデルの更新(勾配・重み)のみをサーバーに送信して集約する分散機械学習手法です。
2017年にGoogleが提唱し、スマートフォンの入力予測・音声認識の改善に適用しました。データそのものは移動しないため、プライバシー保護とAIの性能向上を両立できます。
連合学習の仕組み
中央サーバー(グローバルモデル)
↓ モデル配布
┌─────────────────────────────┐
│ デバイス/組織A │ デバイス/組織B │ デバイス/組織C │
│ ローカル学習 │ ローカル学習 │ ローカル学習 │
└─────────────────────────────┘
↓ モデル更新(勾配)のみ送信
中央サーバー(集約・グローバルモデル更新)
↓ 繰り返し
精度向上したグローバルモデル
連合学習の活用例
| 分野 | 活用例 |
|---|---|
| スマートフォン | キーボード予測・音声認識の改善(Google Gboard) |
| 医療 | 複数病院のカルテデータを共有せずに疾患予測モデルを学習 |
| 金融 | 複数銀行が顧客データを共有せずに詐欺検知モデルを共同改善 |
| 製造 | 複数工場の設備データで故障予知モデルを共同学習 |
歴史と背景
- 2017年:Googleが「Communication-Efficient Learning of Deep Networks from Decentralized Data」でFederated Learningを提唱
- 2019年以降:医療・金融分野での応用研究が急増
- 現在:差分プライバシー・セキュアアグリゲーションとの組み合わせでさらに強固なプライバシー保護が進む
関連用語
- 機械学習 — 連合学習が分散化した機械学習
- AI安全性 — プライバシー保護はAI安全性の重要な側面
- AI倫理 — データプライバシーを守るAI開発の倫理
- エッジAI — 連合学習はエッジデバイスでの分散学習に応用
- ファインチューニング — 連合学習で各組織が共同でモデルをファインチューニング