生成AI・深層学習

GAN(敵対的生成ネットワーク) がん

GAN生成ネットワーク識別ネットワークDeepFakeデータ拡張画像生成
GANって何のためにあるの?

簡単に言うとこんな感じ!

GANは「偽物を作るAI」と「本物か偽物か見抜くAI」を競い合わせて、どんどん精巧な偽物を生成させる仕組みだよ!本物そっくりの顔写真・風景画像・音声を生成できて、ゲームのテクスチャ生成や医療データの水増しにも使われてるんだ。


GAN(敵対的生成ネットワーク)とは

GAN(Generative Adversarial Network:敵対的生成ネットワーク) とは、**生成器(Generator)識別器(Discriminator)**という2つのニューラルネットワークを「競わせる」ことで、リアルな画像・音声・テキストを生成する機械学習アーキテクチャです。

2014年にIan Goodfellowが提案し、AI分野に革命をもたらしました。ディープフェイク動画から医療画像の生成まで、様々な応用があります。


GANの仕組み

ランダムノイズ(潜在空間)

生成器(Generator)
    ↓ 偽の画像を生成
識別器(Discriminator)
    ├── 本物の画像も入力
    └── 本物?偽物?を判定
         ↓ 誤り率をフィードバック
生成器と識別器が交互に更新
    ↓ 生成器が騙し上手になる
    ↓ 識別器が見抜き上手になる
ナッシュ均衡 → 本物と区別できない生成物

GANの応用例

用途内容
画像生成リアルな顔写真・風景・アートの生成
超解像度低解像度画像を高解像度に変換
データ拡張訓練データが少ない分野での合成データ生成
医療画像MRI・X線画像の合成で学習データを増やす
スタイル変換写真→絵画スタイル変換(CycleGAN等)
DeepFake動画内の人物の顔を別の顔に差し替え(悪用例)

歴史と背景

  • 2014年:Ian GoodfellowがGANを提案(モントリオール大学)
  • 2016年:DCGANで高品質な画像生成が可能に
  • 2019年:StyleGANで超リアルな顔生成が実現
  • 2021年以降拡散モデル(Stable Diffusion等)がGANに代わり主流に

関連用語