大規模言語モデル(LLM) だいきぼげんごもでる
簡単に言うとこんな感じ!
インターネット上の膨大なテキストで学習した超巨大AIモデルのことだよ!ChatGPT・Gemini・Claude・Llama…これらが全部LLM。文章を書く・要約する・翻訳する・コードを書く・質問に答えるなど、言語に関することなら何でもこなせるんだ。まさに「万能文章AI」だよ!
大規模言語モデル(LLM)とは
大規模言語モデル(LLM: Large Language Model) とは、数十億〜数兆のパラメータを持ち、インターネット・書籍・コードなど大量のテキストデータで事前学習したTransformerベースの言語AIモデルです。GPT・BERT・Claudeなど現代の主要なテキストAIはすべてLLMの一種です。
LLMの最大の特徴は 汎用性 です。翻訳・要約・分類・Q&A・コード生成・文章作成など、従来は個別にモデルを開発していたタスクを1つのモデルで対応できます。また In-Context Learning(文脈内学習) という能力により、プロンプト(指示文)に数例を示すだけで、追加学習なしに新しいタスクに対応できます。
ビジネス活用では大きく3つの方式があります。①API利用(OpenAI・Anthropic・Googleのモデルをクラウド経由で呼び出す、初期コスト低・データ管理注意)、②ファインチューニング(自社データで追加学習して業務特化させる)、③オンプレミス展開(Llama等のオープンソースモデルを社内サーバーで運用、データ機密性が高い場合に選択)。
主要LLMの比較
| モデル | 開発元 | 特徴 | 利用形態 |
|---|---|---|---|
| GPT-4o | OpenAI | 高精度・マルチモーダル | API・ChatGPT |
| Claude 3.5/4 | Anthropic | 長文・安全性・コード | API・Claude.ai |
| Gemini 2.0 | 検索連携・マルチモーダル | API・Gemini | |
| Llama 3.x | Meta | オープンソース・商用可 | セルフホスト |
| Mistral | Mistral AI | 軽量・オープン | API・セルフホスト |
| Command R+ | Cohere | RAG特化・Enterprise | API |
LLMの能力の広がり
歴史と背景
- 2017年 — Transformerアーキテクチャ発表。LLMの技術基盤が確立
- 2018年 — BERT(Google)・GPT-1(OpenAI)発表。事前学習モデルの時代へ
- 2020年 — GPT-3(1,750億パラメータ)が「スケーリング則」を実証。大きいほど賢い
- 2021年 — Codex(コード生成モデル)が登場。GitHub Copilotに採用
- 2022年11月 — ChatGPTが公開。一般ユーザーがLLMを日常的に使う時代へ
- 2023年 — Llama・Mistral等のオープンソースLLMが相次いで公開
- 2024年〜 — マルチモーダル・エージェント(自律タスク実行)・長文脈対応が主要トレンドに
スケーリング則と Emergent Abilities
スケーリング則(Scaling Laws) とは、「モデルのパラメータ数・学習データ量・計算量を増やすと、予測可能に性能が向上する」という経験則です。この法則に従い、各社がモデルを大型化し続けています。
また一定規模を超えると 創発的能力(Emergent Abilities) と呼ばれる、事前に予測できなかった新能力(数学的推論・コード生成・多段階の論理推論など)が突然出現することも知られています。
| モデル規模の目安 | 代表的な特徴 |
|---|---|
| ~70億パラメータ | 単純な質問応答・文書分類が可能 |
| 70〜700億パラメータ | 推論・コード生成・多言語対応が向上 |
| 700億〜 | 複雑な推論・創造的な文章生成・専門知識 |
関連する規格・RFC
| 規格・RFC番号 | 内容 |
|---|---|
| ISO/IEC 42001 | AI管理システムの国際規格(LLM導入時の管理指針) |
| EU AI Act | 高リスクAIシステムとしてLLMの規制対象を規定 |
関連用語
- GPT — OpenAIのLLMシリーズ
- BERT — Googleの言語理解LLMモデル
- Transformer — LLMの基盤となるアーキテクチャ
- プロンプトエンジニアリング — LLMへの指示文を設計する技術
- RAG — LLMに外部知識を組み合わせる技術
- ファインチューニング — LLMを業務特化させる追加学習
- 生成AI — テキスト・画像などを生成するAI技術の総称