LOF(局所外れ値因子) えるおーえふ・きょくしょはずれちいんし
LOF局所外れ値因子密度ベース異常検知Local Outlier Factor外れ値スコア
LOFについて教えて
LOFとは
LOF(Local Outlier Factor:局所外れ値因子)は、各データ点の局所的な密度を近傍との比較で算出し、密度が著しく低い点を異常として検出するアルゴリズムです。1999年にBreunigらが提案しました。
LOFスコアの解釈
LOFスコア ≈ 1.0 → 正常(周囲と同じくらいの密度)
LOFスコア >> 1.0 → 異常(周囲より密度が低い、孤立している)
厳密には:
LOF(p) = 周辺k-近傍のlrd(平均) / lrd(p)
lrd:局所到達可能密度
直感的な例
密な市街地に住む人A(低LOF = 正常)
郊外に独立して住む人B(高LOF = 異常)
← 密な市街地 → ← 郊外 →
○○○○○○ ×
Aの密度と周辺の密度は同じ → LOF ≈ 1
Bの密度は周辺より著しく低い → LOF >> 1
Isolation Forestとの使い分け
| 状況 | 推奨手法 |
|---|---|
| 大規模データ(万件〜) | Isolation Forest |
| 小〜中規模データ | LOF |
| 密度が均一なデータ | どちらでも可 |
| 密度が不均一なデータ | LOF が有効 |
歴史と背景
関連用語
- 異常検知 — LOFが解決するタスク
- Isolation Forest — 代替の異常検知手法(大規模向け)
- DBSCAN — 密度の概念を共有するアルゴリズム
- 外れ値 — LOFで検出する対象
- k近傍法 — LOFが応用するkNN概念