OpenAIは、2025年4月17日、新たにo3およびo4-miniという2つのAIモデルを発表しました。これらは、画像を“理解し思考”する能力を備えた初のモデルであり、ChatGPT Plusユーザーを対象に本日から利用可能となっています。
o3とo4-miniの特徴とは?
高度な推論能力とマルチツール統合
OpenAIによると、o3は同社のモデルの中で最も高度な推論モデルであり、特にコーディング、数学、科学の分野で強力な性能を発揮します。一方、o4-miniは低コストながら高性能を実現した、より軽量な選択肢です。
両モデルは、以下のような革新的な機能を持ちます:
- ウェブブラウジング、画像生成などすべてのツールにアクセス可能
- ホワイトボードや手描き図の画像を認識・理解
- 画像を使って思考し、問題解決に活用
- 複数ステップの問題もツール連携で高精度に処理
画像を使って「考える」AIへ
o3とo4-miniの最大の進化は、画像に対してただ「見る」のではなく、画像を“思考の一部”として活用できる点です。たとえば、以下のような画像処理が可能です:
- 手書きの数式やフローチャートの理解
- 不鮮明な写真やスキャン画像の解析
- 画像上の要素に基づく推論や編集
これにより、教育現場や研究機関、クリエイティブ業務などにおいて、従来のテキスト主体のAIでは対応できなかった領域にも対応可能となります。
新ツール「Codex CLI」も同時発表
さらに、OpenAIは開発者向けに新しいコーディングエージェント「Codex CLI」をリリースしました。これは、ローカル環境とOpenAIモデルを連携させるための最小限インターフェースであり、特にo3とo4-miniとの連携に最適化されています。
将来的にはGPT-4.1との互換性も追加される予定です。
GPT-5への布石?ロードマップの変更
当初、OpenAIはo3の独立リリースを見送る予定でしたが、サム・アルトマンCEOは「計画を変更した」とXで表明。その理由として以下を挙げています:
- GPT-5をさらに強化できる見通しが立った
- o3/o4-miniの統合が想定より困難だった
- 大規模な需要への対応に向けたキャパシティ確保が必要
これにより、当初計画されていた製品ラインの統合は、GPT-5の登場まで先送りとなる見込みです。
現在利用可能なプラン
以下のプランに加入しているユーザーは、すでにo3およびo4-miniを利用可能です:
- ChatGPT Plus
- ChatGPT Pro
- ChatGPT Team
また、今後数週間以内に上位モデル「o3-pro」もリリース予定で、Proユーザー向けに展開される予定です。
まとめ:画像と推論を融合する次世代AI、実用フェーズへ
OpenAIの新モデル「o3」と「o4-mini」は、単なるチャットAIを超え、“視覚的な思考”を可能にするツールへと進化しました。これにより、教育・開発・ビジネス・クリエイティブなど、あらゆる分野での活用が加速することが期待されます。


コメント