データと前処理

特徴量とくちょうりょう

特徴量フィーチャー変数入力データ特徴エンジニアリング

特徴量について教えて

簡単に言うとこんな感じ！

機械学習モデルへの「入力情報」のことだよ。家の価格を予測するなら「面積・築年数・駅からの距離・間取り」がそれぞれ特徴量。何をどう特徴量として表現するかで、モデルの精度が大きく変わるんだ！

特徴量（Feature）とは、機械学習モデルへの入力として使用される、データの測定可能な属性・変数のことです。英語の “Feature” をそのままカタカナにして「フィーチャー」と呼ぶこともあります。

モデルは特徴量のパターンからラベル（正解）との関係を学習します。そのため、「何を特徴量として用意するか」は、アルゴリズム選択よりもモデル精度に影響を与えることが多いと言われています。

特徴量エンジニアリングとは、生データから予測に有用な特徴量を作成・変換する作業です。

従来の機械学習
  生データ → [人手による特徴量設計] → [モデル] → 予測

ディープラーニング
  生データ → [自動特徴量抽出（ネットワーク内部）] → 予測

ディープラーニングは特徴量エンジニアリングの必要性を大幅に低減しましたが、表形式データ（テーブルデータ）では今も人手での特徴量設計が有効です。