学習(機械学習) がくしゅう(きかいがくしゅう)
簡単に言うとこんな感じ!
大量のデータを見せて「正解のパターン」をコンピュータに覚えさせる作業だよ!人間が「失敗から学ぶ」のと同じで、AIも「たくさんの例」を見ることで、正解を予測できるようになるんだ。
学習とは
機械学習における学習(Training)とは、AIモデルが大量のデータからパターンや規則を自動的に見つけ出すプロセスのことです。人間が経験を積んで知識を習得するように、コンピュータはデータを繰り返し処理することで、予測や判断の精度を高めていきます。
学習の本質は「誤差を減らすこと」にあります。最初はランダムに近い予測しかできないモデルが、正解データと自分の予測のずれ(誤差)を少しずつ修正することで、精度の高いモデルへと成長していきます。このプロセスを数千〜数億回繰り返すのが「学習」の実態です。
ビジネスの現場では、学習済みのモデルを使って「スパムメールの自動振り分け」「売上予測」「画像認識による品質検査」など、さまざまな業務を自動化しています。どんな精度のAIができるかは、どんなデータで・どう学習させたかに大きく左右されます。
学習の種類と仕組み
AIの学習には大きく3つのアプローチがあります。どれを選ぶかは「手元にどんなデータがあるか」で決まります。
| 種類 | 日本語 | 特徴 | 使用例 |
|---|---|---|---|
| Supervised Learning | 教師あり学習 | 正解ラベル付きデータで学習 | メール分類・売上予測 |
| Unsupervised Learning | 教師なし学習 | 正解なしでパターンを発見 | 顧客セグメント・異常検知 |
| Reinforcement Learning | 強化学習 | 試行錯誤で報酬を最大化 | ゲームAI・ロボット制御 |
学習の流れを覚える「予測→誤差→修正」の3ステップ
- 予測(Forward Pass) — モデルがデータを見て答えを出す
- 誤差計算(Loss) — 正解と予測のズレを数値化する
- 修正(Backpropagation) — ズレが小さくなるようにモデルの内部パラメータを調整する
この3ステップを何万回も繰り返すことが「学習」です。語呂合わせで「よ(予測)・ご(誤差)・し(修正)」と覚えるとスッキリ!
学習に必要な3つの要素
| 要素 | 役割 | ビジネスでの言い換え |
|---|---|---|
| データ | 学習の原材料 | 過去の取引履歴・顧客情報 |
| モデル | 学習する器(アルゴリズム) | 問題を解く「方程式の型」 |
| ハイパーパラメータ | 学習の設定値 | 勉強の「ペース・量・方針」 |
歴史と背景
- 1950年代 — アラン・チューリングが「機械は学習できるか?」という問いを提起。機械学習の概念的な原点
- 1957年 — フランク・ローゼンブラットがパーセプトロン(ニューラルネットワークの祖先)を発表
- 1986年 — 誤差逆伝播法(バックプロパゲーション) が実用化され、多層ネットワークの学習が可能に
- 1990年代 — サポートベクターマシン(SVM)などの手法が登場し、スパム検出などに活用
- 2006年 — ジェフリー・ヒントンらがディープラーニングの学習手法を発表。多層ネットワークの効率的な学習が実現
- 2012年 — 画像認識コンペ「ImageNet」でディープラーニングが圧勝。AIブームの転換点
- 2017年 — GoogleがTransformerアーキテクチャを発表。自然言語処理の学習効率が飛躍的に向上
- 2020年代 — GPT・ChatGPTなど大規模言語モデルの登場で、「学習」が一般の関心ごとに
学習の種類:構造と対比
教師あり学習・教師なし学習・強化学習の3つが、どんな状況で使われるかを視覚的に整理します。
過学習(Overfitting)に注意
学習をやりすぎると「過学習(Overfitting)」が起きます。これは、テスト勉強で「過去問の答えを丸暗記した結果、少し違う問題が出たら全くわからない」状態に似ています。学習データには完璧に合うが、新しいデータには全く使えないモデルになってしまいます。
過学習のイメージ
精度
100%| ●学習データ ← ほぼ完璧
| ●
70% | ●
| ● ← テストデータは下がっていく
50% | ●
| ●テストデータ
+--------------------→ 学習量
これを防ぐために「検証データ(Validation Data)」を使って定期的に汎化性能(未知のデータへの対応力)を確認しながら学習を進めます。
関連する規格・RFC
※ 機械学習の「学習」プロセス自体に特定のIETF RFCやIEEE規格は存在しませんが、関連するデータ形式・APIについては以下を参照。
| 規格・仕様 | 内容 |
|---|---|
| ONNX(Open Neural Network Exchange) | 学習済みモデルを異なるフレームワーク間で共有するための標準フォーマット |
| ISO/IEC 22989 | AI概念・用語の国際標準(「学習」の定義も含む) |
関連用語
- ./018-machine-learning.md — 機械学習:データからパターンを自動的に学ぶAIの手法全般
- ./020-deep-learning.md — ディープラーニング:多層ニューラルネットワークを使った高度な学習手法
- ./021-neural-network.md — ニューラルネットワーク:人間の脳の神経回路を模倣したモデル構造
- ./022-training-data.md — 学習データ:AIに学習させるための元となるデータセット
- ./023-overfitting.md — 過学習:学習しすぎて汎化性能が落ちてしまう現象
- ./024-model.md — モデル:学習結果を格納した予測・判断を行うプログラムの型
- ./025-llm.md — 大規模言語モデル(LLM):大量テキストデータで学習した自然言語AIの一種
- ./017-ai.md — 人工知能(AI):機械学習・学習を含む知的処理全般を行うシステム