混同行列 こんどうぎょうれつ
TPFPFNTN分類評価PrecisionRecall
混同行列について教えて
簡単に言うとこんな感じ!
AIの「答え合わせ内訳表」だよ!「正解を正解と当てた」「間違いを間違いと当てた」「正解なのに間違いと言った」「間違いなのに正解と言った」という4パターンを表に整理したもので、AIがどんな種類のミスをしているかを一目で把握できるんだ。精度・再現率・F値は全部この表から計算できるって!
混同行列とは
混同行列(Confusion Matrix)とは、分類モデルの予測結果を「正解ラベルとの組み合わせ」で整理した表です。二値分類(陽性/陰性の2クラス)の場合、予測と正解の組み合わせは4通りあり、これを縦(実際のクラス)× 横(予測クラス)の2×2の行列で表します。
混同行列は「モデルがどんな間違いをしているか」を可視化するためのツールです。全体の正解率(Accuracy)だけでは分からない「見逃し」と「誤検知」の内訳が一覧できます。これにより、業務上どちらのミスがより問題かに応じて、閾値の調整や改善の方向を決めることができます。
多クラス分類(3クラス以上)でも混同行列は使えます。その場合 n×n の行列になり、対角線上のセルが正しく分類されたデータ数になります。
混同行列の4つのセル
| 予測:陽性(Positive) | 予測:陰性(Negative) | |
|---|---|---|
| 実際:陽性 | TP(真陽性) 正しく陽性と予測 | FN(偽陰性) 陽性なのに陰性と予測(見逃し) |
| 実際:陰性 | FP(偽陽性) 陰性なのに陽性と予測(誤検知) | TN(真陰性) 正しく陰性と予測 |
各セルが業務で意味すること(例:不正検知AI)
| セル | 業務上の意味 | 影響 |
|---|---|---|
| TP(真陽性) | 本物の不正を不正と検知 | 望ましい検出 |
| TN(真陰性) | 正常な取引を正常と判定 | 正しいスルー |
| FP(偽陽性) | 正常な取引を誤って不正と判定 | 顧客へ無用な連絡・摩擦 |
| FN(偽陰性) | 本物の不正を見逃す | 被害が発生する(危険) |
歴史と背景
- 1904年:Karl Pearsonが分割表(Contingency Table)という形で混同行列の原型を統計学に導入
- 1940〜50年代:信号検出理論(Signal Detection Theory)でTPR・FPRの概念が発展
- 1950年代後半:情報検索の評価でPrecision・Recallと混同行列の関係が体系化される
- 1960〜70年代:心理学・診断医学での検査精度評価にROC解析とともに普及
- 1990年代:機械学習の評価基準として混同行列が標準化。scikit-learnなどに標準実装される
- 現在:ディープラーニングモデルの評価・デバッグツールとして、ヒートマップ形式での可視化が広く使われる
混同行列と評価指標の関係
関連する規格・RFC
| 規格・RFC番号 | 内容 |
|---|---|
| ISO/IEC 22989:2022 | AI概念・用語(分類モデルの評価方法を含む) |
| ISO/IEC TR 24029-1 | ニューラルネットワークの正確さ評価方法 |