EfficientNet いふぃしぇんとねっと
EfficientNetモデルスケーリングCNN画像認識複合スケーリングGoogle
EfficientNetについて教えて
EfficientNetとは
EfficientNet は、2019年にGoogleのMingxing TanとQuoc V. Leが発表した高効率な画像分類CNNアーキテクチャです。従来のモデルが「層を深くするだけ」「チャンネル数を増やすだけ」と1つの軸だけをスケールしていたのに対し、EfficientNetは深さ(Depth)・幅(Width)・解像度(Resolution)の3軸を同時にバランスよく拡大する「複合スケーリング」を提案しました。
EfficientNet-B0(最小版)をベースに、B0〜B7まで段階的にスケールしたバリアントが存在します。EfficientNet-B7はImageNetでTop-1精度84.3%を達成し、当時のSOTA(最高性能)を大幅に更新しました。
精度・パラメータ数・計算量の比率が優れており、モバイルデバイス〜大規模サーバーまで幅広い用途で採用されました。
複合スケーリングの考え方
従来のスケーリング:
深さのみ拡大 → 幅や解像度が不足し精度向上に限界
幅のみ拡大 → 深さが不足しパラメータ数が膨大に
解像度のみ拡大 → 受容野が追いつかない
EfficientNetの複合スケーリング:
depth × width × resolution を同時に係数αβγで調整
→ 計算量2倍あたりの精度向上が最大になるバランスを数値探索
| モデル | パラメータ数 | Top-1精度 | 計算量(FLOPS) |
|---|---|---|---|
| EfficientNet-B0 | 540万 | 77.1% | 0.39G |
| EfficientNet-B4 | 1900万 | 82.6% | 4.2G |
| EfficientNet-B7 | 6600万 | 84.3% | 37G |
| ResNet-50(参考) | 2500万 | 76.1% | 4.1G |
歴史と背景
- 2019年:論文「EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks」発表
- 2019年:ImageNet Top-1精度84.3%(B7)でSOTAを達成
- 2020年:EfficientDet(物体検出版)も同様のスケーリングで高効率を実現
- 2021年以降:Vision Transformer(ViT)系モデルが台頭し、最高精度の座は譲るが実用面で人気継続
EfficientNetの活用シーン
| シーン | EfficientNetの有利な点 |
|---|---|
| スマートフォンアプリ | B0〜B2でモバイル動作 |
| 精度重視の企業AI | B5〜B7で高精度 |
| 転移学習ベース | 豊富な学習済みモデルと実績 |
| Kaggleコンペ | 精度・効率バランスでよく使われる |
関連用語
- ResNet — EfficientNetが精度・効率で超えたベースラインモデル
- MobileNet — 同じく効率重視のCNNアーキテクチャ
- CNN(畳み込みニューラルネットワーク) — EfficientNetが採用する基本構造
- 転移学習 — EfficientNetが広く使われる学習手法