主要AIモデル

o1 / o3(OpenAI推論モデル) おーわん / おーすりー(おーぷんえーあいすいろんもでる)

o1o3OpenAI推論モデルChain-of-Thought数学・科学
o1 / o3について教えて

簡単に言うとこんな感じ!

「答える前にじっくり考える」ことに特化したOpenAIのモデルシリーズだよ!数学オリンピックや難しいコーディング問題で人間のエキスパートに匹敵する性能を持つ。速さより「深い思考」を重視した、難問専用の切り札みたいなモデルなんだ!


o1 / o3(OpenAI推論モデル)とは

o1・o3 とは、OpenAIが開発した「推論(Reasoning)」に特化したLLMシリーズです。通常のGPT系モデルがすぐに回答を生成するのに対し、o1系は回答前に長い思考(Chain-of-Thought)を内部で展開し、複数のアプローチを試した上で最善の回答を出力します。

o1(2024年9月発表)はIOI(国際情報オリンピック)で89パーセンタイル、数学・科学の難問で博士レベルの正答率を達成しました。後継のo3(2024年12月発表)はさらに強化され、AGI(汎用人工知能)の評価指標「ARC-AGI」で87.5%を達成し話題となりました。数学・コード・科学的推論に非常に強い一方、単純な会話や一般タスクではコストが高すぎる場合があります。


o1とo3の主な違い

項目o1o3
発表2024年9月2024年12月
推論性能高いさらに高い
計算コスト高い非常に高い
ARC-AGI83%87.5%
思考時間数秒〜数十秒数分〜(設定可能)
軽量版o1-minio3-mini

歴史と背景

  • 2024年9月:o1-previewとo1-miniをChatGPT Plusユーザー向けに公開
  • 2024年12月:o1の正式版とo3・o3-miniを発表
  • 2025年1月:o3-miniをAPI・ChatGPTで公開
  • 2025年4月:o3をChatGPT Plusで公開、o4-miniも同時発表
  • 現在GPT-4o系(速度・コスト重視)とo3系(精度・推論重視)の2系統が並立

o1/o3が得意なタスク

【o1/o3が圧倒的に得意な場面】
- 難しい数学問題(AMC/AIME/IMO相当)
- 競技プログラミング(Codeforces, LeetCode Hard)
- 科学的推論(生物・物理・化学の問題)
- 多ステップの論理パズル

【GPT-4oで十分な場面】
- 日常的なQ&A・文書作成
- 一般的なコード生成
- 翻訳・要約・チャット
→ o1/o3はコストが高いため、用途に合わせて使い分けが重要

関連用語