
OpenAI、新AIモデル「GPT-5.4」を発表 推論・コーディング・エージェント機能を強化
OpenAIは3月5日、最新AIモデル「GPT-5.4」を発表した。推論能力、コーディング性能、エージェント機能を統合した同社の新しいフロンティアモデルで、文書作成、スプレッドシート分析、ソフトウェア開発などの実務タスクをより正確かつ効率的に処理できるよう設計されている。モデルはChatGPT、API、Codexで提供され、より高い性能を求めるユーザー向けに「GPT-5.4 Pro」も公開された。
実務タスクの性能を強化
GPT-5.4は、従来モデルの推論能力とコーディング性能を統合して開発された。
OpenAIの評価では、44職種の知識労働タスクを対象としたベンチマークで、GPT-5.4は約83%のケースで業界の専門家と同等、またはそれ以上の成果を示したという。
評価対象には次のような実務作業が含まれている。
- 営業プレゼン資料の作成
- 会計用スプレッドシートの作成
- 業務スケジュールの設計
- 業務文書や分析レポートの作成
また、スプレッドシート作成テストでは、投資銀行アナリストの業務を想定した課題で従来モデルより大幅に高いスコアを記録。プレゼンテーション生成でも、人間の評価者がGPT-5.4の出力をより高く評価する割合が増えたとしている。
コンピューター操作機能を標準搭載
GPT-5.4の大きな特徴の一つが、コンピューター操作機能を標準で備えた点だ。
AIはスクリーンショットから画面の内容を理解し、マウス操作やキーボード入力を通じてアプリケーションやウェブサイトを操作できる。これにより、次のような作業を自動化するAIエージェントの開発が可能になる。
- メール送信
- カレンダー登録
- ブラウザ操作
- データ入力
OpenAIによるテストでは、デスクトップ操作能力を測定するベンチマークで、GPT-5.4は従来モデルより大幅に高い成功率を記録した。
長文処理とツール連携も改善
GPT-5.4は最大100万トークンのコンテキストに対応する。
これにより、長い文書や複雑なワークフローを一度に処理できる。
また、ツールの利用方法も改善された。AIは多数のツールの中から必要なものを選び、検索して使用できるようになった。これにより、ツールが多いシステムでも効率的に作業を進められるという。
さらに、問題解決に必要なトークン数も削減されており、処理速度の向上とコスト削減につながるとしている。
コーディングとアプリ開発にも対応
GPT-5.4はコーディング性能も強化されている。
たとえば、Playwrightなどのツールを利用し、ブラウザ操作やアプリケーションのテストを自動化できる。AIがコードを書くだけでなく、アプリを実際に操作して動作を確認し、問題を修正する開発ワークフローにも対応する。
OpenAIは、こうした機能によりAIエージェントを使ったソフトウェア開発や業務自動化がより実用的になるとしている。

Fumi Nozawa
デジタルマーケター & ストラテジスト
Paul Smith、Boucheronといったグローバルブランドでデジタルマーケティングを担当。現在は海外を拠点に、戦略設計からWeb実装までを牽引。マーケターとしての視点とテクノロジーへの理解を活かし、欧米企業の日本進出やブランド成長を支援しています。
プロジェクトの相談、その他ご相談など、 お気軽にお問い合わせください。
他の記事も読む

Anthropicがサイエンスブログを開設:100年分の科学進歩を数年に凝縮するビジョンを公開
Anthropicが科学研究とAIの融合をテーマにした「サイエンスブログ」を開設。数十年分の科学的進歩を数年に凝縮するビジョンに基づき、最新の研究成果や、研究者がAIを実務に導入するための実践的なワークフロー、外部機関との共同研究について発信します。

Anthropic、AIがPCを直接操作する「Computer Use」発表。スマホからタスクを「割り当てる」新機能も
AnthropicがClaudeの新機能「Computer Use」を発表。PC画面を認識し、マウス操作やクリックをAIが代行。新機能「Dispatch」により、外出先のスマホから自宅PCへタスクを割り当てる自律型ワークフローが実現します。