OpenAI、より高度な推論とコーディング、エージェント機能を統合したAIモデル「GPT-5.4 Thinking」のロールアウトを開始。

GPT 5.4 by OpenAI ChatGPT&AI
記事内に広告が含まれています。This article contains advertisements.
スポンサーリンク

 OpenAIがより高度な推論とコーディング、エージェント機能を統合したAIモデル「GPT-5.4 Thinking/Pro」のロールアウトを開始しています。詳細は以下から。

ChatGPT for Mac

 米OpenAIは現地時間2026年03月05日、同社のChatGPTアプリなどに採用しているAIモデル「GPT-5」シリーズの最新のフラグシップモデルとなる「GPT-5.4」をGPT‑5.4 Thinkingとして、複雑なタスクで最高のパフォーマンスを発揮するモデルをGPT-5.4 Proとしてロールアウトを開始したと発表しています。

GPT-5.4 Thinking in ChatGPT

Today, we’re releasing GPT‑5.4 in ChatGPT (as GPT‑5.4 Thinking), the API, and Codex. It’s our most capable and efficient frontier model for professional work. We’re also releasing GPT‑5.4 Pro in ChatGPT and the API, for people who want maximum performance on complex tasks.

GPT-5.4 Thinking in ChatGPT – OpenAI

 GPT-5.4はOpenAIが作根年12月にリリースしたGPT-5.2と比較してプレゼンやスプレッドシート、スケジュール、図形の作成など44の実務作業を行う実務タスクベンチマーク「GDPval」において、プロと同等の成果物を作成できる割合が10%以上向上し、はじめて80%を超えたそうで、

GPT-5.4のGDPvalスコア

GPT-5.4のGDPvalスコア

スプレッドシートの作成能力では投資銀行のアナリストが行う財務モデルの作成がGPT-5.2の68.4%から、GPT-5.4では87.3%へ向上し、プレゼンテーション作成能力は68.0%のケースでGPT-5.4が作成したプレゼンテーションが優れていると評価されたそうです。

GPT-5.4と5.2が作成したスプレッドシートとプレゼンテーション

GPT-5.4と5.2が作成したスプレッドシートとプレゼンテーション

 また、GPT-5.4は汎用モデルとして初めてネイティブなコンピュータの操作能力を持ったモデルとなっており、スクリーンショットとキーボード&マウス操作をおこなってデスクトップ環境を操作する能力を評価するOSWorld-Verifiedでは、GPT-5.2が正しい操作を成功させたのが47.3%だったのに対し、GPT-5.4は75.0%とこれを大きく上回り、人間が行った際の成功率72.4%も超えたそうです。

OSWorld-Verified

OSWorld-Verified 縦軸は成功率、横軸はツールの応答を待つだめにAIが処理を中断した回数(少ない方がBetter)

 OpenAIは本日より有料プランのユーザーと開発者(API)向けにGPT-5.4のロールアウトを開始しており、PlusとTeam, Proの有料プランユーザーはGPT-5.4 ThinkingがGPT-5.2 Thinkingに置き換わる形で、GPT-5.4 ProはProとEnterpriseプランユーザー向けに提供されているそうなので、有料プランユーザーの方はチェックしてみて下さい。

GPT-5.4 Thinking

*GPT-5.2 Thinkingはレガシーモデルとして3ヶ月利用可能。

コメント

タイトルとURLをコピーしました