コンピュータービジョン

YOLO よろ

YOLOYou Only Look Once物体検出リアルタイム検出バウンディングボックス1段階検出

YOLOについて教えて

簡単に言うとこんな感じ！

YOLOは「画像を1回見るだけで全物体を同時に検出する」リアルタイム物体検出モデルだよ。「You Only Look Once（一回だけ見る）」の略！従来の手法が何度も画像を見直すのに対し、1回のCNN処理で「どこに何がある」を高速に判断するんだ！

YOLOとは

YOLO（You Only Look Once） は2016年にJoseph Redmonらが提案した1段階（One-Stage）の物体検出アルゴリズムです。画像をグリッドに分割し、各グリッドセルが直接バウンディングボックスとクラス確率を予測することで、1回のニューラルネットワーク処理で物体検出を完結させます。

従来の2段階検出（R-CNNなど）は「候補領域の提案→各領域の分類」という2ステップで精度は高いが低速でした。YOLOは1ステップで処理するためリアルタイム検出（45FPS以上） を実現しました。

バージョンを重ねるごとに精度と速度が向上し、現在はYOLOv8・YOLOv9・YOLOv11などが活発に開発されています。防犯カメラ・製造ラインの品質検査・自動運転など幅広い実用場面で採用されています。

YOLOの検出の仕組み

入力画像
    ↓
S×S のグリッドに分割（例：13×13）
    ↓
各グリッドセルが以下を予測：
  - B個のバウンディングボックス（x, y, w, h, 信頼度）
  - C個のクラス確率
    ↓
信頼度閾値フィルタリング + NMS（非最大値抑制）
    ↓
最終検出結果（クラス + 位置）

YOLOのバージョン進化

バージョン	年	特徴
YOLOv1	2016	1段階検出の基礎。45FPS
YOLOv2（YOLO9000）	2017	アンカーボックス導入。9000クラス対応
YOLOv3	2018	マルチスケール検出。精度向上
YOLOv4	2020	多数の最新技術を組み合わせたSOTA
YOLOv5	2020	Ultralytics製。PyTorch実装。使いやすさで普及
YOLOv8	2023	セグメンテーション・姿勢推定にも対応

歴史と背景

2016年：Redmonらが「You Only Look Once」論文を発表。リアルタイム検出を実現
2018年：YOLOv3が小物体検出を改善。実用的な精度と速度のバランスを達成
2020年：YOLOv5（Ultralytics）がOSSとして公開。使いやすさで爆発的に普及
現在：YOLOは物体検出の「事実上の標準」として産業界で広く使用

物体検出手法の比較

手法	カテゴリ	速度	精度	向いている用途
YOLO	1段階	高い（リアルタイム）	中〜高	監視カメラ・品質検査
SSD	1段階	高い	中程度	組み込み・モバイル
Faster R-CNN	2段階	低い（オフライン）	高い	精度重視の解析
DETR	Transformer	中程度	高い	研究・精度重視

YOLOとは

YOLOの検出の仕組み

YOLOのバージョン進化

歴史と背景

物体検出手法の比較

関連用語