企業事例 / Company case

次世代AIモデル「GPT-5」:開発者のためのコーディング&エージェント・パートナー

OpenAIは、コーディングとエージェント型タスクに特化した最新モデル「GPT-5」をリリースしました。従来のモデルを凌駕する知能と、開発者の意図を汲み取る柔軟性を備えた、まさに「実務のためのAI」の誕生です。                                出所:Open AI

1. コーディング性能:世界最高水準を塗り替える.

  • 驚異のベンチマーク実績: 実務性能を測る「SWE-bench Verified」で74.9%、コード編集の「Aider polyglot」で**88%**を記録。
  • 効率とスピードの両立: 前モデル(o3)と比較して、出力トークンを22%削減、ツール呼び出しを45%削減。より少ないリソースで、より速く正確な成果を出せます。

2. 進化した「自律型エージェント」能力:長時間にわたる複雑なタスクでも卓越した安定感.

  • ツール操作の精度: ベンチマーク「τ2-bench telecom」で**96.7%**という驚異的な的中率。複数のツールを並列・連続して使いこなします。
  • 自発的なタスク遂行: ユーザーの指示を待つだけでなく、自発的に次のステップを提案・実行する「意欲」が向上しました。
  • 透明性の確保(プリアンブル): ツール実行の合間に「今何をしているか、次の計画は何か」を説明するメッセージを出力。ブラックボックス化を防ぎます。

3. 開発者の痒いところに手が届く新機能 /APIを通じて、挙動をより細かくコントロール可能に!

  • reasoning_effort(推論レベル): 新たに “minimal” が追加。深い推論を省き、スピード優先で回答を得たい場合に最適です。
  • verbosity(回答の長さ): 回答の詳しさを3段階(low, medium, high)で調整可能に。
  • プレーンテキスト対応ツール: 従来のJSON形式に加え、プレーンテキストでのツール呼び出しが可能に。エスケープ処理によるエラーから解放されます。

4. 圧倒的な信頼性と巨大なコンテキスト

  • ハルシネーションの劇的削減: 事実誤認を誘発するテストにおいて、o3比で約80%のミス削減に成功。
  • 広大な作業領域: 最大 272,000 入力トークン(合計最大40万トークン)に対応。大規模なリポジトリや数千ページのドキュメントを一気に読み解けます。

関連記事

TOP