o1 / o3(OpenAI推論モデル) おーわん / おーすりー(おーぷんえーあいすいろんもでる)
o1o3OpenAI推論モデルChain-of-Thought数学・科学
o1 / o3について教えて
簡単に言うとこんな感じ!
「答える前にじっくり考える」ことに特化したOpenAIのモデルシリーズだよ!数学オリンピックや難しいコーディング問題で人間のエキスパートに匹敵する性能を持つ。速さより「深い思考」を重視した、難問専用の切り札みたいなモデルなんだ!
o1 / o3(OpenAI推論モデル)とは
o1・o3 とは、OpenAIが開発した「推論(Reasoning)」に特化したLLMシリーズです。通常のGPT系モデルがすぐに回答を生成するのに対し、o1系は回答前に長い思考(Chain-of-Thought)を内部で展開し、複数のアプローチを試した上で最善の回答を出力します。
o1(2024年9月発表)はIOI(国際情報オリンピック)で89パーセンタイル、数学・科学の難問で博士レベルの正答率を達成しました。後継のo3(2024年12月発表)はさらに強化され、AGI(汎用人工知能)の評価指標「ARC-AGI」で87.5%を達成し話題となりました。数学・コード・科学的推論に非常に強い一方、単純な会話や一般タスクではコストが高すぎる場合があります。
o1とo3の主な違い
| 項目 | o1 | o3 |
|---|---|---|
| 発表 | 2024年9月 | 2024年12月 |
| 推論性能 | 高い | さらに高い |
| 計算コスト | 高い | 非常に高い |
| ARC-AGI | 83% | 87.5% |
| 思考時間 | 数秒〜数十秒 | 数分〜(設定可能) |
| 軽量版 | o1-mini | o3-mini |
歴史と背景
- 2024年9月:o1-previewとo1-miniをChatGPT Plusユーザー向けに公開
- 2024年12月:o1の正式版とo3・o3-miniを発表
- 2025年1月:o3-miniをAPI・ChatGPTで公開
- 2025年4月:o3をChatGPT Plusで公開、o4-miniも同時発表
- 現在:GPT-4o系(速度・コスト重視)とo3系(精度・推論重視)の2系統が並立
o1/o3が得意なタスク
【o1/o3が圧倒的に得意な場面】
- 難しい数学問題(AMC/AIME/IMO相当)
- 競技プログラミング(Codeforces, LeetCode Hard)
- 科学的推論(生物・物理・化学の問題)
- 多ステップの論理パズル
【GPT-4oで十分な場面】
- 日常的なQ&A・文書作成
- 一般的なコード生成
- 翻訳・要約・チャット
→ o1/o3はコストが高いため、用途に合わせて使い分けが重要