コンピュータービジョン

姿勢推定 しせいすいてい

姿勢推定Pose Estimation骨格推定キーポイント検出人体認識スポーツ分析
姿勢推定について教えて

簡単に言うとこんな感じ!

姿勢推定は「画像・動画から人間の関節の位置(手首・肘・肩・膝など)を検出して骨格を推定する」技術だよ。スポーツのフォーム分析・ゲームのジェスチャー操作・リハビリの動作チェックなどに使われる、まさに「AIが人の体を読む」技術なんだ!


姿勢推定とは

姿勢推定(Pose Estimation) は、画像・動画から人体の関節(キーポイント:頭・首・肩・肘・手首・腰・膝・足首など)の位置を推定し、骨格モデルを構築するコンピュータービジョンのタスクです。

一般に17〜25個のキーポイントを検出し、それぞれの(x, y)座標と信頼度スコアを出力します。人間1人を対象とするSingle-Person Pose Estimationと、複数人を同時に推定するMulti-Person Pose Estimationがあります。

近年は2Dの画像から3Dの関節位置を推定する3D姿勢推定も実用化されており、AR・VR・モーションキャプチャーなどへの応用が広がっています。


主要な姿勢推定モデル

モデル特徴用途
OpenPoseMulti-Person対応。関節を2段階で推定リアルタイム・複数人
HRNet高解像度特徴マップを維持して高精度高精度な単人推定
MediaPipe PoseGoogleの軽量実装。スマホでも動作モバイルアプリ
ViTPoseVision Transformerベースの高精度モデル研究・高精度

歴史と背景

  • 2014年:DeepCutが深層学習を使った姿勢推定を開始
  • 2016年:OpenPoseがリアルタイム多人数姿勢推定を実現し普及
  • 2019年:HRNetが高解像度特徴マップ維持で精度を大幅向上
  • 2020年:Google MediaPipe PoseがスマートフォンでのリアルタイムPose推定を実現
  • 現在:3D姿勢推定・動作認識との統合が進み、スポーツ・医療・介護で普及

活用シーン

分野用途
スポーツ分析フォーム改善、ファウルの自動判定
医療・リハビリ歩行障害・姿勢異常の客観評価
介護転倒検知、危険姿勢のアラート
ゲーム・ARジェスチャー操作、バーチャル試着
製造業作業員の安全姿勢確認、動作効率化
映画・VFXモーションキャプチャーの省コスト化

出力データの例

キーポイントの出力例(COCO形式):
[
  {"id": 0, "name": "nose",        "x": 320, "y": 80,  "confidence": 0.98},
  {"id": 5, "name": "left_shoulder","x": 280, "y": 150, "confidence": 0.95},
  {"id": 6, "name": "right_shoulder","x": 360, "y": 148, "confidence": 0.97},
  {"id": 7, "name": "left_elbow",   "x": 250, "y": 220, "confidence": 0.92},
  ...
]

関連用語