AI・機械学習

大規模言語モデル（LLM）だいきぼげんごもでる

LLMChatGPTGeminiClaude事前学習基盤モデル

大規模言語モデル（LLM）について教えて

簡単に言うとこんな感じ！

インターネット上の膨大なテキストで学習した超巨大AIモデルのことだよ！ChatGPT・Gemini・Claude・Llama…これらが全部LLM。文章を書く・要約する・翻訳する・コードを書く・質問に答えるなど、言語に関することなら何でもこなせるんだ。まさに「万能文章AI」だよ！

大規模言語モデル（LLM）とは

大規模言語モデル（LLM: Large Language Model） とは、数十億〜数兆のパラメータを持ち、インターネット・書籍・コードなど大量のテキストデータで事前学習したTransformerベースの言語AIモデルです。GPT・BERT・Claudeなど現代の主要なテキストAIはすべてLLMの一種です。

LLMの最大の特徴は 汎用性 です。翻訳・要約・分類・Q&A・コード生成・文章作成など、従来は個別にモデルを開発していたタスクを1つのモデルで対応できます。また In-Context Learning（文脈内学習） という能力により、プロンプト（指示文）に数例を示すだけで、追加学習なしに新しいタスクに対応できます。

ビジネス活用では大きく3つの方式があります。①API利用（OpenAI・Anthropic・Googleのモデルをクラウド経由で呼び出す、初期コスト低・データ管理注意）、②ファインチューニング（自社データで追加学習して業務特化させる）、③オンプレミス展開（Llama等のオープンソースモデルを社内サーバーで運用、データ機密性が高い場合に選択）。

主要LLMの比較

モデル	開発元	特徴	利用形態
GPT-4o	OpenAI	高精度・マルチモーダル	API・ChatGPT
Claude 3.5/4	Anthropic	長文・安全性・コード	API・Claude.ai
Gemini 2.0	Google	検索連携・マルチモーダル	API・Gemini
Llama 3.x	Meta	オープンソース・商用可	セルフホスト
Mistral	Mistral AI	軽量・オープン	API・セルフホスト
Command R+	Cohere	RAG特化・Enterprise	API

LLMの能力の広がり

歴史と背景

2017年 — Transformerアーキテクチャ発表。LLMの技術基盤が確立
2018年 — BERT（Google）・GPT-1（OpenAI）発表。事前学習モデルの時代へ
2020年 — GPT-3（1,750億パラメータ）が「スケーリング則」を実証。大きいほど賢い
2021年 — Codex（コード生成モデル）が登場。GitHub Copilotに採用
2022年11月 — ChatGPTが公開。一般ユーザーがLLMを日常的に使う時代へ
2023年 — Llama・Mistral等のオープンソースLLMが相次いで公開
2024年〜 — マルチモーダル・エージェント（自律タスク実行）・長文脈対応が主要トレンドに

スケーリング則と Emergent Abilities

スケーリング則（Scaling Laws） とは、「モデルのパラメータ数・学習データ量・計算量を増やすと、予測可能に性能が向上する」という経験則です。この法則に従い、各社がモデルを大型化し続けています。

また一定規模を超えると 創発的能力（Emergent Abilities） と呼ばれる、事前に予測できなかった新能力（数学的推論・コード生成・多段階の論理推論など）が突然出現することも知られています。

モデル規模の目安	代表的な特徴
～70億パラメータ	単純な質問応答・文書分類が可能
70〜700億パラメータ	推論・コード生成・多言語対応が向上
700億〜	複雑な推論・創造的な文章生成・専門知識

規格・RFC番号	内容
ISO/IEC 42001	AI管理システムの国際規格（LLM導入時の管理指針）
EU AI Act	高リスクAIシステムとしてLLMの規制対象を規定