News

2025.04.30

知財ニュース

OpenAI、最新AIモデル「o3」と「o4-mini」を公開―ChatGPT史上最強レベル、ツール選択のエージェント機能を搭載

スクリーンショット 2025-04-27 14.11.33

OpenAIは年4月16日、最新の高性能AIモデル「o3」と、その小型版「o4-mini」を発表した。OpenAIがこれまでに開発した中で最も高度な推論モデルとされている。

両モデルは、ChatGPT内でウェブ検索、Python実行、画像解析、ファイル解析、画像生成などのツールを自律的に活用できるエージェント機能を初めて搭載している。複雑な質問に対し、最適なツールを自ら判断して詳細な回答を通常1分以内に生成。多岐にわたるタスクをユーザーに代わって実行できる、より進化したChatGPTが実現する。

スクリーンショット 2025-04-27 14.11.59

OpenAI o3は、コーディング、数学、科学、視覚認識など広範な分野で最高レベルの性能を誇る、強力な推論モデル。Codeforces、SWE-bench、MMMUといった主要なベンチマークで新記録を達成し、多角的な分析が必要な複雑な質問や、画像・グラフ分析といった視覚タスクで特に優れているという。専門家評価では、以前のo1モデルと比較して重大なエラーを20%削減し、プログラミング、ビジネスコンサルティング、創造的なアイデア創出で際立った性能を示した。初期テスターからは、厳密な分析力に加え、生物学、数学、工学分野における仮説生成・評価能力が高く評価されている。

一方、OpenAI o4-miniは、高速かつコスト効率の高い推論に特化した小型モデルでありながら、数学、コーディング、視覚タスクにおいて驚異的な性能を発揮する。AIME 2024・2025のベンチマークテストで最高成績を収め、特にPythonインタープリターを活用したAIME 2025では、92.7%の合格率を達成したという。

専門家からは、両モデルとも知能とウェブ情報活用能力が向上し、以前のモデルより指示への追従性が高く、有用で検証可能な回答を提供するものと評価された。また、過去の会話を記憶し参照することで、より自然でパーソナライズされた対話体験を実感でき、これまでのChatGPTの能力を飛躍的に向上させるものとして注目を集めている。

プレスリリースはこちら

Top Image : © Open AI

広告