YOLO よろ
YOLOYou Only Look Once物体検出リアルタイム検出バウンディングボックス1段階検出
YOLOについて教えて
YOLOとは
YOLO(You Only Look Once) は2016年にJoseph Redmonらが提案した1段階(One-Stage)の物体検出アルゴリズムです。画像をグリッドに分割し、各グリッドセルが直接バウンディングボックスとクラス確率を予測することで、1回のニューラルネットワーク処理で物体検出を完結させます。
従来の2段階検出(R-CNNなど)は「候補領域の提案→各領域の分類」という2ステップで精度は高いが低速でした。YOLOは1ステップで処理するためリアルタイム検出(45FPS以上) を実現しました。
バージョンを重ねるごとに精度と速度が向上し、現在はYOLOv8・YOLOv9・YOLOv11などが活発に開発されています。防犯カメラ・製造ラインの品質検査・自動運転など幅広い実用場面で採用されています。
YOLOの検出の仕組み
入力画像
↓
S×S のグリッドに分割(例:13×13)
↓
各グリッドセルが以下を予測:
- B個のバウンディングボックス(x, y, w, h, 信頼度)
- C個のクラス確率
↓
信頼度閾値フィルタリング + NMS(非最大値抑制)
↓
最終検出結果(クラス + 位置)
YOLOのバージョン進化
| バージョン | 年 | 特徴 |
|---|---|---|
| YOLOv1 | 2016 | 1段階検出の基礎。45FPS |
| YOLOv2(YOLO9000) | 2017 | アンカーボックス導入。9000クラス対応 |
| YOLOv3 | 2018 | マルチスケール検出。精度向上 |
| YOLOv4 | 2020 | 多数の最新技術を組み合わせたSOTA |
| YOLOv5 | 2020 | Ultralytics製。PyTorch実装。使いやすさで普及 |
| YOLOv8 | 2023 | セグメンテーション・姿勢推定にも対応 |
歴史と背景
- 2016年:Redmonらが「You Only Look Once」論文を発表。リアルタイム検出を実現
- 2018年:YOLOv3が小物体検出を改善。実用的な精度と速度のバランスを達成
- 2020年:YOLOv5(Ultralytics)がOSSとして公開。使いやすさで爆発的に普及
- 現在:YOLOは物体検出の「事実上の標準」として産業界で広く使用
物体検出手法の比較
| 手法 | カテゴリ | 速度 | 精度 | 向いている用途 |
|---|---|---|---|---|
| YOLO | 1段階 | 高い(リアルタイム) | 中〜高 | 監視カメラ・品質検査 |
| SSD | 1段階 | 高い | 中程度 | 組み込み・モバイル |
| Faster R-CNN | 2段階 | 低い(オフライン) | 高い | 精度重視の解析 |
| DETR | Transformer | 中程度 | 高い | 研究・精度重視 |
関連用語
- 物体検出 — YOLOが属するコンピュータービジョンのタスク
- SSD(Single Shot MultiBox Detector) — YOLOと同じ1段階検出手法
- Faster R-CNN — YOLOと対比される2段階検出手法
- CNN(畳み込みニューラルネットワーク) — YOLOのバックボーンとなる技術