コンピュータービジョン

YOLO よろ

YOLOYou Only Look Once物体検出リアルタイム検出バウンディングボックス1段階検出
YOLOについて教えて

簡単に言うとこんな感じ!

YOLOは「画像を1回見るだけで全物体を同時に検出する」リアルタイム物体検出モデルだよ。「You Only Look Once(一回だけ見る)」の略!従来の手法が何度も画像を見直すのに対し、1回のCNN処理で「どこに何がある」を高速に判断するんだ!


YOLOとは

YOLO(You Only Look Once) は2016年にJoseph Redmonらが提案した1段階(One-Stage)の物体検出アルゴリズムです。画像をグリッドに分割し、各グリッドセルが直接バウンディングボックスとクラス確率を予測することで、1回のニューラルネットワーク処理で物体検出を完結させます。

従来の2段階検出(R-CNNなど)は「候補領域の提案→各領域の分類」という2ステップで精度は高いが低速でした。YOLOは1ステップで処理するためリアルタイム検出(45FPS以上) を実現しました。

バージョンを重ねるごとに精度と速度が向上し、現在はYOLOv8・YOLOv9・YOLOv11などが活発に開発されています。防犯カメラ・製造ラインの品質検査・自動運転など幅広い実用場面で採用されています。


YOLOの検出の仕組み

入力画像

S×S のグリッドに分割(例:13×13)

各グリッドセルが以下を予測:
  - B個のバウンディングボックス(x, y, w, h, 信頼度)
  - C個のクラス確率

信頼度閾値フィルタリング + NMS(非最大値抑制)

最終検出結果(クラス + 位置)

YOLOのバージョン進化

バージョン特徴
YOLOv120161段階検出の基礎。45FPS
YOLOv2(YOLO9000)2017アンカーボックス導入。9000クラス対応
YOLOv32018マルチスケール検出。精度向上
YOLOv42020多数の最新技術を組み合わせたSOTA
YOLOv52020Ultralytics製。PyTorch実装。使いやすさで普及
YOLOv82023セグメンテーション・姿勢推定にも対応

歴史と背景

  • 2016年:Redmonらが「You Only Look Once」論文を発表。リアルタイム検出を実現
  • 2018年:YOLOv3が小物体検出を改善。実用的な精度と速度のバランスを達成
  • 2020年:YOLOv5(Ultralytics)がOSSとして公開。使いやすさで爆発的に普及
  • 現在:YOLOは物体検出の「事実上の標準」として産業界で広く使用

物体検出手法の比較

手法カテゴリ速度精度向いている用途
YOLO1段階高い(リアルタイム)中〜高監視カメラ・品質検査
SSD1段階高い中程度組み込み・モバイル
Faster R-CNN2段階低い(オフライン)高い精度重視の解析
DETRTransformer中程度高い研究・精度重視

関連用語