AI・機械学習の基本概念

混同行列 こんどうぎょうれつ

TPFPFNTN分類評価PrecisionRecall
混同行列について教えて

簡単に言うとこんな感じ!

AIの「答え合わせ内訳表」だよ!「正解を正解と当てた」「間違いを間違いと当てた」「正解なのに間違いと言った」「間違いなのに正解と言った」という4パターンを表に整理したもので、AIがどんな種類のミスをしているかを一目で把握できるんだ。精度・再現率・F値は全部この表から計算できるって!


混同行列とは

混同行列(Confusion Matrix)とは、分類モデル予測結果を「正解ラベルとの組み合わせ」で整理した表です。二値分類(陽性/陰性の2クラス)の場合、予測と正解の組み合わせは4通りあり、これを縦(実際のクラス)× 横(予測クラス)の2×2の行列で表します。

混同行列は「モデルがどんな間違いをしているか」を可視化するためのツールです。全体の正解率(Accuracy)だけでは分からない「見逃し」と「誤検知」の内訳が一覧できます。これにより、業務上どちらのミスがより問題かに応じて、閾値の調整や改善の方向を決めることができます。

クラス分類(3クラス以上)でも混同行列は使えます。その場合 n×n の行列になり、対角線上のセルが正しく分類されたデータ数になります。


混同行列の4つのセル

予測:陽性(Positive)予測:陰性(Negative)
実際:陽性TP(真陽性) 正しく陽性と予測FN(偽陰性) 陽性なのに陰性と予測(見逃し)
実際:陰性FP(偽陽性) 陰性なのに陽性と予測(誤検知)TN(真陰性) 正しく陰性と予測

各セルが業務で意味すること(例:不正検知AI)

セル業務上の意味影響
TP(真陽性)本物の不正を不正と検知望ましい検出
TN(真陰性)正常な取引を正常と判定正しいスルー
FP(偽陽性)正常な取引を誤って不正と判定顧客へ無用な連絡・摩擦
FN(偽陰性)本物の不正を見逃す被害が発生する(危険)

歴史と背景

  • 1904年:Karl Pearsonが分割表(Contingency Table)という形で混同行列の原型を統計学に導入
  • 1940〜50年代:信号検出理論(Signal Detection Theory)でTPR・FPRの概念が発展
  • 1950年代後半:情報検索の評価でPrecision・Recallと混同行列の関係が体系化される
  • 1960〜70年代:心理学・診断医学での検査精度評価にROC解析とともに普及
  • 1990年代機械学習の評価基準として混同行列が標準化。scikit-learnなどに標準実装される
  • 現在ディープラーニングモデルの評価・デバッグツールとして、ヒートマップ形式での可視化が広く使われる

混同行列と評価指標の関係

混同行列と主要評価指標の対応 予測:陽性 予測:陰性 実際:陽性 実際:陰性 TP 真陽性 正しく陽性を検出 FN 偽陰性 見逃し(危険!) FP 偽陽性 誤検知(コスト) TN 真陰性 正しく陰性を判定 Precision(精度) TP / (TP + FP) 予測陽性の正確さ Recall(再現率) TP / (TP + FN) 本物の陽性の検出率 Accuracy(正解率) (TP + TN) / 全件数 F1 Score 2×P×R / (P+R) 対角線(TP+TN)が多いほど良いモデル。非対角線(FP+FN)が多いほど問題あり

関連する規格・RFC

規格・RFC番号内容
ISO/IEC 22989:2022AI概念・用語(分類モデルの評価方法を含む)
ISO/IEC TR 24029-1ニューラルネットワークの正確さ評価方法

関連用語