F
🇺🇸 EN🇯🇵 JA

OpenAI、新AIモデル「GPT-5.4」を発表 推論・コーディング・エージェント機能を強化

AIニュース
|Fumi Nozawa

OpenAIは3月5日、最新AIモデル「GPT-5.4」を発表した。推論能力、コーディング性能、エージェント機能を統合した同社の新しいフロンティアモデルで、文書作成、スプレッドシート分析、ソフトウェア開発などの実務タスクをより正確かつ効率的に処理できるよう設計されている。モデルはChatGPT、API、Codexで提供され、より高い性能を求めるユーザー向けに「GPT-5.4 Pro」も公開された。

実務タスクの性能を強化

GPT-5.4は、従来モデルの推論能力とコーディング性能を統合して開発された。
OpenAIの評価では、44職種の知識労働タスクを対象としたベンチマークで、GPT-5.4は約83%のケースで業界の専門家と同等、またはそれ以上の成果を示したという。

評価対象には次のような実務作業が含まれている。

  • 営業プレゼン資料の作成
  • 会計用スプレッドシートの作成
  • 業務スケジュールの設計
  • 業務文書や分析レポートの作成

また、スプレッドシート作成テストでは、投資銀行アナリストの業務を想定した課題で従来モデルより大幅に高いスコアを記録。プレゼンテーション生成でも、人間の評価者がGPT-5.4の出力をより高く評価する割合が増えたとしている。

コンピューター操作機能を標準搭載

GPT-5.4の大きな特徴の一つが、コンピューター操作機能を標準で備えた点だ。

AIはスクリーンショットから画面の内容を理解し、マウス操作やキーボード入力を通じてアプリケーションやウェブサイトを操作できる。これにより、次のような作業を自動化するAIエージェントの開発が可能になる。

  • メール送信
  • カレンダー登録
  • ブラウザ操作
  • データ入力

OpenAIによるテストでは、デスクトップ操作能力を測定するベンチマークで、GPT-5.4は従来モデルより大幅に高い成功率を記録した。

長文処理とツール連携も改善

GPT-5.4は最大100万トークンのコンテキストに対応する。
これにより、長い文書や複雑なワークフローを一度に処理できる。

また、ツールの利用方法も改善された。AIは多数のツールの中から必要なものを選び、検索して使用できるようになった。これにより、ツールが多いシステムでも効率的に作業を進められるという。

さらに、問題解決に必要なトークン数も削減されており、処理速度の向上とコスト削減につながるとしている。

コーディングとアプリ開発にも対応

GPT-5.4はコーディング性能も強化されている。

たとえば、Playwrightなどのツールを利用し、ブラウザ操作やアプリケーションのテストを自動化できる。AIがコードを書くだけでなく、アプリを実際に操作して動作を確認し、問題を修正する開発ワークフローにも対応する。

OpenAIは、こうした機能によりAIエージェントを使ったソフトウェア開発や業務自動化がより実用的になるとしている。

この記事をシェア

Fumi Nozawa

Fumi Nozawa

デジタルマーケター & ストラテジスト

Paul Smith、Boucheronといったグローバルブランドでデジタルマーケティングを担当。現在は海外を拠点に、戦略設計からWeb実装までを牽引。マーケターとしての視点とテクノロジーへの理解を活かし、欧米企業の日本進出やブランド成長を支援しています。

日本進出支援日本企業の海外進出支援Web開発デジタル体験ブランド戦略デジタル広告

プロジェクトの相談、その他ご相談など、 お気軽にお問い合わせください。