ホーム
Blog
企業事例 / Company case
次世代AIモデル「GPT-5」：開発者のためのコーディング＆エージェント・パートナー

企業事例 / Company case

次世代AIモデル「GPT-5」：開発者のためのコーディング＆エージェント・パートナー

2025.08.07

OpenAIは、コーディングとエージェント型タスクに特化した最新モデル「GPT-5」をリリースしました。従来のモデルを凌駕する知能と、開発者の意図を汲み取る柔軟性を備えた、まさに「実務のためのAI」の誕生です。　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　出所：Open AI

1. コーディング性能：世界最高水準を塗り替える.

驚異のベンチマーク実績： 実務性能を測る「SWE-bench Verified」で74.9%、コード編集の「Aider polyglot」で**88%**を記録。
効率とスピードの両立： 前モデル（o3）と比較して、出力トークンを22%削減、ツール呼び出しを45%削減。より少ないリソースで、より速く正確な成果を出せます。

2. 進化した「自律型エージェント」能力：長時間にわたる複雑なタスクでも卓越した安定感.

ツール操作の精度： ベンチマーク「τ2-bench telecom」で**96.7%**という驚異的な的中率。複数のツールを並列・連続して使いこなします。
自発的なタスク遂行： ユーザーの指示を待つだけでなく、自発的に次のステップを提案・実行する「意欲」が向上しました。
透明性の確保（プリアンブル）： ツール実行の合間に「今何をしているか、次の計画は何か」を説明するメッセージを出力。ブラックボックス化を防ぎます。

3. 開発者の痒いところに手が届く新機能 /APIを通じて、挙動をより細かくコントロール可能に！

reasoning_effort（推論レベル）： 新たに “minimal” が追加。深い推論を省き、スピード優先で回答を得たい場合に最適です。
verbosity（回答の長さ）： 回答の詳しさを3段階（low, medium, high）で調整可能に。
プレーンテキスト対応ツール： 従来のJSON形式に加え、プレーンテキストでのツール呼び出しが可能に。エスケープ処理によるエラーから解放されます。

4. 圧倒的な信頼性と巨大なコンテキスト

ハルシネーションの劇的削減： 事実誤認を誘発するテストにおいて、o3比で約80%のミス削減に成功。
広大な作業領域： 最大 272,000 入力トークン（合計最大40万トークン）に対応。大規模なリポジトリや数千ページのドキュメントを一気に読み解けます。

2025世界AI大会（WAIC）：上海で示されたAIの未来と国際協力の新潮流

前の記事

Gemini Robotics 1.5 を発表：AIエージェントが物理世界へ！

次の記事

関連記事

Gemini Robotics 1.5 を発表：AIエージェントが物理世界へ！

カテゴリー

アーカイブ