AI・機械学習の基本概念

モデル もでる

機械学習学習済みモデルパラメータ推論トレーニングニューラルネットワーク
モデルについて教えて

簡単に言うとこんな感じ!

AIが「大量のデータから学んだ知識」をギュッと詰め込んだファイルのことだよ!料理レシピで言うと、何万回も試作して完成した「黄金レシピ」みたいなもの。このレシピ(モデル)があれば、材料(新しいデータ)を入れるだけで美味しい料理(予測・回答)が出てくるってこと!


モデルとは

AIや機械学習の世界で「モデル」とは、大量のデータをもとに学習した結果として得られた数学的な構造体のことです。平たく言うと、「過去の経験(データ)から学んだルールの塊」であり、新しいデータを入力すると予測や判断・回答を出力してくれる仕組みです。ソフトウェアファイルとして保存・配布・利用できるため、「学習済みモデル」として取引・公開されることも多くあります。

モデルは大きく2つのフェーズで使われます。学習(トレーニング)フェーズでは、大量のデータをモデルに与えて内部のパラメータ(数値の重み)を調整し、精度を高めていきます。推論(インファレンス)フェーズでは、完成したモデルに新しいデータを入れて結果を得ます。ビジネス現場で「AIを使う」と言うとき、ほとんどの場合はこの推論フェーズだけを利用しています。

GPT」「Gemini」「Claude」といった生成AIの名前を聞いたことがあるかもしれませんが、これらもすべて「モデル」です。膨大なテキストデータで学習した結果、人間らしい文章を生成できるようになった巨大なモデルというわけです。


モデルの構造と仕組み

モデルの中身は、基本的にはパラメータと呼ばれる無数の数値(重み)で構成されています。学習によってこの数値が最適化され、「正しい答えを出せる関数」ができあがります。

要素役割料理で言うと
入力データモデルに与える情報(テキスト・画像など)材料
パラメータ(重み)学習によって調整された内部の数値群調味料の配合比率
アーキテクチャモデルの設計図・構造(層の数・種類など)調理工程・手順書
出力予測・分類・生成された結果完成した料理
損失関数学習中に「どれだけ間違えたか」を測る指標味見して何点か採点

モデルサイズの目安

モデルの規模はパラメータ数で表現されることが多いです。数が多いほど複雑な表現が可能になりますが、その分計算資源も大きく必要になります。

規模感パラメータ数の目安代表例
小規模数百万〜数億画像分類モデルなど
中規模数十億(数B)軽量LLM(スマホ動作も可)
大規模数百億〜数兆(数百B〜T)GPT-4、Gemini Ultraなど

覚え方

「モデル=学習した知識の缶詰」と覚えよう!缶詰は製造(学習)に手間がかかるけど、一度できれば開けるだけ(推論)で中身が使えます。自分で缶詰を作る(学習する)のは大変なので、できあいの缶詰(学習済みモデル)を使うのがビジネスの基本です。


歴史と背景

  • 1950年代 — アラン・チューリングが「機械は考えられるか」という問いを提起し、数学的なモデルの概念が芽生え始める
  • 1957年 — フランク・ローゼンブラットがパーセプトロンニューラルネットワークの原型となるモデル)を発表
  • 1980〜90年代バックプロパゲーション(誤差逆伝播法)の普及で、多層ニューラルネットワークの学習が現実的に
  • 2012年AlexNetが画像認識コンテスト(ImageNet)で圧勝。ディープラーニング(深層学習)モデルの時代が到来
  • 2017年 — Googleが「Transformer」アーキテクチャを発表。現在の大規模言語モデル(LLM)の礎となる
  • 2020年 — OpenAIがGPT-3(1750億パラメータ)を公開。モデルの大規模化が加速
  • 2022年 — ChatGPTが一般公開され、AIモデルが「使うもの」としてビジネス現場へ急速に普及
  • 2023年〜 — オープンソースモデル(LLaMA、Mistralなど)の台頭。モデルの民主化が進む

モデルの種類と関連技術

AIモデルにはさまざまな種類があり、用途によって使い分けられます。

AIモデルの主な種類 言語モデル (LLM) テキスト生成 GPT / Gemini / Claude 翻訳・要約 DeepL / mBART コード生成 Copilot / CodeLlama 画像モデル (Vision) 画像分類・認識 ResNet / ViT 画像生成 Stable Diffusion / DALL-E 物体検出 YOLO / Detectron 予測モデル (Prediction) 需要予測・売上予測 時系列モデル 異常検知 Isolation Forest 顧客分類 クラスタリング 音声モデル (Audio) 音声認識 Whisper 音声合成(TTS) VOICEVOX / ElevenLabs 音楽生成 MusicGen 📦 提供形態 API経由で利用 (OpenAI API等) オープンソース (自社サーバーで動かす) クラウドサービス組み込み (AzureAI / AWS Bedrock等)

「学習済みモデル」と「ファインチューニング」の違い

学習済みモデル(そのまま利用)ファインチューニング(追加学習)
イメージ市販の家電を使う家電を自社仕様に改造する
コスト低い(API利用料のみ)高い(GPU・データ準備が必要)
カスタマイズ性低い高い(自社データに特化可能)
向いているケース汎用的なタスク(翻訳・要約など)専門用語・社内ドキュメント対応など

関連用語