主要AIモデル

o1 / o3（OpenAI推論モデル）おーわん / おーすりー（おーぷんえーあいすいろんもでる）

o1o3OpenAI推論モデルChain-of-Thought数学・科学

o1 / o3について教えて

簡単に言うとこんな感じ！

「答える前にじっくり考える」ことに特化したOpenAIのモデルシリーズだよ！数学オリンピックや難しいコーディング問題で人間のエキスパートに匹敵する性能を持つ。速さより「深い思考」を重視した、難問専用の切り札みたいなモデルなんだ！

o1 / o3（OpenAI推論モデル）とは

o1・o3 とは、OpenAIが開発した「推論（Reasoning）」に特化したLLMシリーズです。通常のGPT系モデルがすぐに回答を生成するのに対し、o1系は回答前に長い思考（Chain-of-Thought）を内部で展開し、複数のアプローチを試した上で最善の回答を出力します。

o1（2024年9月発表）はIOI（国際情報オリンピック）で89パーセンタイル、数学・科学の難問で博士レベルの正答率を達成しました。後継のo3（2024年12月発表）はさらに強化され、AGI（汎用人工知能）の評価指標「ARC-AGI」で87.5%を達成し話題となりました。数学・コード・科学的推論に非常に強い一方、単純な会話や一般タスクではコストが高すぎる場合があります。

o1とo3の主な違い

項目	o1	o3
発表	2024年9月	2024年12月
推論性能	高い	さらに高い
計算コスト	高い	非常に高い
ARC-AGI	83%	87.5%
思考時間	数秒〜数十秒	数分〜（設定可能）
軽量版	o1-mini	o3-mini

歴史と背景

2024年9月：o1-previewとo1-miniをChatGPT Plusユーザー向けに公開
2024年12月：o1の正式版とo3・o3-miniを発表
2025年1月：o3-miniをAPI・ChatGPTで公開
2025年4月：o3をChatGPT Plusで公開、o4-miniも同時発表
現在：GPT-4o系（速度・コスト重視）とo3系（精度・推論重視）の2系統が並立

o1/o3が得意なタスク

【o1/o3が圧倒的に得意な場面】
- 難しい数学問題（AMC/AIME/IMO相当）
- 競技プログラミング（Codeforces, LeetCode Hard）
- 科学的推論（生物・物理・化学の問題）
- 多ステップの論理パズル

【GPT-4oで十分な場面】
- 日常的なQ&A・文書作成
- 一般的なコード生成
- 翻訳・要約・チャット
→ o1/o3はコストが高いため、用途に合わせて使い分けが重要

o1 / o3（OpenAI推論モデル）とは

o1とo3の主な違い

歴史と背景

o1/o3が得意なタスク

関連用語