GAN(敵対的生成ネットワーク) がん
GAN生成ネットワーク識別ネットワークDeepFakeデータ拡張画像生成
GANって何のためにあるの?
簡単に言うとこんな感じ!
GANは「偽物を作るAI」と「本物か偽物か見抜くAI」を競い合わせて、どんどん精巧な偽物を生成させる仕組みだよ!本物そっくりの顔写真・風景画像・音声を生成できて、ゲームのテクスチャ生成や医療データの水増しにも使われてるんだ。
GAN(敵対的生成ネットワーク)とは
GAN(Generative Adversarial Network:敵対的生成ネットワーク) とは、**生成器(Generator)と識別器(Discriminator)**という2つのニューラルネットワークを「競わせる」ことで、リアルな画像・音声・テキストを生成する機械学習アーキテクチャです。
2014年にIan Goodfellowが提案し、AI分野に革命をもたらしました。ディープフェイク動画から医療画像の生成まで、様々な応用があります。
GANの仕組み
ランダムノイズ(潜在空間)
↓
生成器(Generator)
↓ 偽の画像を生成
識別器(Discriminator)
├── 本物の画像も入力
└── 本物?偽物?を判定
↓ 誤り率をフィードバック
生成器と識別器が交互に更新
↓ 生成器が騙し上手になる
↓ 識別器が見抜き上手になる
ナッシュ均衡 → 本物と区別できない生成物
GANの応用例
| 用途 | 内容 |
|---|---|
| 画像生成 | リアルな顔写真・風景・アートの生成 |
| 超解像度 | 低解像度画像を高解像度に変換 |
| データ拡張 | 訓練データが少ない分野での合成データ生成 |
| 医療画像 | MRI・X線画像の合成で学習データを増やす |
| スタイル変換 | 写真→絵画スタイル変換(CycleGAN等) |
| DeepFake | 動画内の人物の顔を別の顔に差し替え(悪用例) |
歴史と背景
- 2014年:Ian GoodfellowがGANを提案(モントリオール大学)
- 2016年:DCGANで高品質な画像生成が可能に
- 2019年:StyleGANで超リアルな顔生成が実現
- 2021年以降:拡散モデル(Stable Diffusion等)がGANに代わり主流に