予測 よそく
機械学習推論モデル回帰分類教師あり学習
予測について教えて
簡単に言うとこんな感じ!
過去のデータをもとに「次に何が起きるか」「これは何か」をAIが答えを出すことだよ!天気予報みたいに「明日の売上はこのくらい」「このメールはスパムっぽい」ってAIが判断してくれるイメージなんだ。
予測とは
機械学習における予測(Prediction)とは、学習済みのモデルに新しいデータを入力し、「答え」を導き出す処理のことです。人間で言えば「経験をもとに判断する」行為に相当し、AIがその役割を担います。
予測は機械学習の最終目的地とも言えます。大量のデータでモデルを訓練するのも、精度を評価するのも、すべては「未知のデータに対して正確な予測を出せるようにするため」です。実務では売上予測・需要予測・リスク判定・画像認識など、あらゆる場面で活用されています。
予測を行う段階は**推論(Inference)とも呼ばれ、訓練(学習)フェーズとは明確に区別されます。訓練済みモデルをサービスやシステムに組み込んで予測を実行することをデプロイ(展開)**と言い、ビジネス活用の入口になります。
予測の種類と使われ方
予測には、出力する「答えの形」によっていくつかの種類があります。
| 種類 | 出力される答えの形 | 代表的な活用例 |
|---|---|---|
| 回帰(Regression) | 連続した数値 | 売上予測・気温予測・株価予測 |
| 分類(Classification) | カテゴリ・ラベル | スパム判定・画像認識・病気の診断支援 |
| ランキング | 順位・スコア | 検索結果の並び替え・おすすめ表示 |
| 異常検知 | 正常 / 異常の判定 | 不正アクセス検知・設備の故障予知 |
| 生成(Generation) | テキスト・画像など | 文章生成・画像生成AIの出力 |
「回帰」と「分類」の覚え方
- 回帰 → 数字で返ってくる(「売上は120万円」のように具体的な値)
- 分類 → 名前で返ってくる(「これは猫」「これはスパム」のようにラベル)
数字か名前か、で判断するとスッキリ覚えられます。
予測の精度を測る指標
| 指標 | 主な用途 | 意味 |
|---|---|---|
| MAE(平均絶対誤差) | 回帰 | 予測値と実際の値のズレの平均 |
| RMSE(二乗平均平方根誤差) | 回帰 | 大きなズレをより重視した誤差指標 |
| 精度(Accuracy) | 分類 | 全体のうち正解した割合 |
| 適合率・再現率 | 分類 | 見逃し・誤報のバランスを評価 |
| AUC-ROC | 分類 | モデルの識別能力を総合評価 |
歴史と背景
- 1950年代 — 統計学における回帰分析が予測の基礎として確立。線形回帰は今も現役の手法
- 1980〜90年代 — ニューラルネットワーク・決定木などが登場し、より複雑なパターンの予測が可能に
- 2000年代 — ランダムフォレスト・サポートベクターマシン(SVM)など高精度な手法が普及。Kaggleなどのコンペで実力が競われるように
- 2010年代 — ディープラーニングの台頭により、画像・音声・テキストの予測精度が飛躍的に向上
- 2020年代 — 大規模言語モデル(LLM)の登場で「次の単語を予測する」という仕組みがAI全体の基盤に。ChatGPTなど生成AIも「予測」の延長線上にある
予測の流れ:学習から活用まで
予測が実際にビジネスで使われるまでには、いくつかのステップがあります。
発注側が押さえておくべき「予測の限界」
予測はあくまで確率的な判断であり、必ず一定の誤りが含まれます。発注・導入時には以下を確認しましょう。
- 過学習(Overfitting):訓練データにだけ過剰適応し、新しいデータで精度が落ちる現象
- データの偏り(Bias):偏ったデータで学習すると予測も偏る(例:特定の地域のデータだけで全国向けモデルを作る)
- ドリフト(Drift):時間が経つにつれて現実の傾向が変わり、モデルの精度が落ちていく現象
- 説明可能性:「なぜその予測をしたか」が説明できないモデルは、医療・金融などの分野では使いにくい
関連する規格・RFC
※ 予測・機械学習そのものに対応するIETF RFCやISO/IEEEの主要な国際規格は現時点で標準化が発展途上であるため、このセクションは省略します。なお、AI品質に関しては ISO/IEC 25059(AIシステムの品質モデル)が参照されることがあります。