機械学習・学習手法

モデル評価指標 もでるひょうかしひょう

モデル評価精度再現率F1スコアROC曲線交差検証
AIの精度って何%あれば合格なの?

簡単に言うとこんな感じ!

「精度○%」の一つの数字だけ見ても不十分なんだよ!例えば「病気の検出AI」では「見逃し(見つけるべきものを見逃す率)」が大事で、「迷惑メールフィルタ」では「誤検知(普通のメールを迷惑と判定する率)」が大事。用途によって何を重視するかが変わるんだ。


モデル評価指標とは

モデル評価指標 とは、機械学習モデルの性能をどの観点から測るかを定量化した数値です。ビジネス上の目標や問題の性質によって、最適な指標は異なります。

評価指標を誤ると「数字は良いが実際は役に立たないモデル」になるリスクがあります。ベンダーから「精度XX%」と提示されたとき、「何の精度か」を必ず確認することが重要です。


分類問題の主要指標

混同行列

予測: Positive予測: Negative
実際: PositiveTP(真陽性)FN(偽陰性)← 見逃し
実際: NegativeFP(偽陽性)← 誤検知TN(真陰性)
指標計算式重視する場面
精度(Accuracy)(TP+TN)/(全体)クラスが均等な場合
適合率(Precision)TP/(TP+FP)誤検知を減らしたい場合
再現率(Recall)TP/(TP+FN)見逃しを減らしたい場合
F1スコア2×(P×R)/(P+R)両方のバランスが必要な場合
AUC-ROCROC曲線下の面積閾値に依存しない総合評価

回帰問題の主要指標

指標内容
MAE(平均絶対誤差)予測値と実際値の絶対差の平均
RMSE(二乗平均平方根誤差)大きな誤差をより重視した指標
R²(決定係数)モデルがデータのばらつきを説明できる割合

歴史と背景

  • 統計学の歴史:感度・特異度はROC曲線とともに1950年代の信号検知理論から
  • 深層学習ブーム(2010年代):画像認識コンテスト(ILSVRC)でTop-5精度が標準指標に

関連用語