LLM × AI駆動開発
デイリーリサーチ(2026-03-07)
主要アップデート
- OpenAI GPT-5.4リリース(3/5): ネイティブComputer
Use対応、1Mトークンコンテキストウィンドウ、SWE-Bench Pro
57.7%を達成するOpenAI史上最高性能モデル
- Cursor Automations発表(3/5):
イベント駆動型のAIコーディングエージェント自動実行プラットフォーム。Slack・GitHub・PagerDuty等のトリガーに対応
- OpenAI Codex Security公開(3/6):
AIベースの脆弱性スキャナー。120万コミットをスキャンし、10,561件の高深刻度脆弱性を検出。リサーチプレビューとして提供開始
詳細
OpenAI GPT-5.4
- 概要: OpenAIの最新フラグシップモデル。推論・コーディング・Computer
Useを単一モデルに統合
- 主な性能:
- コンテキストウィンドウ: API版で最大1Mトークン(OpenAI史上最大)
- GDPval(知識労働タスク): 83%(44職種対応)
- OSWorld-Verified(Computer Use): 75.0%(人間の72.4%を超過)
- SWE-Bench Pro: 57.7%
- 個々の主張の誤り率がGPT-5.2比33%減少
- 開発者への影響: ChatGPT
Plus/Team/ProおよびAPI経由で利用可能。Codex・GitHub
Copilot等の下位ツールにも順次搭載予定
- 価格: 2.50/1M入力トークン、15.00/1M出力トークン、$0.25/1Mキャッシュ入力トークン
- ソース: TechCrunch
Cursor Automations
- 概要:
イベント駆動型でAIコーディングエージェントを自動起動するプラットフォーム。「prompt-and-monitor」型からの脱却を目指す
- 主な機能:
- トリガー: Slack、GitHub、PagerDuty、Linear、Webhook、タイマー
- ユースケース:
セキュリティ監査、バグ検出、インシデント対応、週次コードベースサマリー
- 実績: 毎時数百のオートメーションが実行中
- 開発者への影響:
エンジニアはポリシー定義に集中し、エージェントが定常タスクを自律実行。人間は必要な判断ポイントでのみ介入
- ソース: TechCrunch
OpenAI Codex
Security(リサーチプレビュー)
- 概要:
AIベースの脆弱性検出・検証・パッチ提案エージェント。内部ツール「Aardvark」の進化版
- 主な実績:
- 120万コミットをスキャン、792件のクリティカル・10,561件の高深刻度の脆弱性を検出
- 偽陽性率が50%以上低減(一部リポジトリでは84%低減)
- OpenSSH、GnuTLS、PHP、Chromium等のOSSで14件のCVEを発見
- 利用条件: ChatGPT Pro/Enterprise/Business/Eduユーザー向け、Codex
Web経由で1ヶ月無料
- 開発者への影響:
CI/CDパイプラインに組み込むことで、コミット単位の自動セキュリティ監査が可能
- ソース: The
Hacker News
Claude
Code(直近アップデート)
- 概要:
ボイスモードのロールアウト開始(現在約5%のユーザーに提供)、
/loopコマンド追加、HTTPフック対応
- 主な新機能:
/loopコマンド:
プロンプトやスラッシュコマンドを一定間隔で繰り返し実行(例:
/loop 5m check the deploy)
- HTTPフック: シェルコマンドの代わりにHTTP POSTでJSON送受信が可能
- VS Code:
スパークアイコンでセッション一覧表示、プランのフルMarkdownビュー対応
/remote-controlにカスタムセッション名を指定可能
- 音声STTが20言語対応に拡大
- 設定方法:
claude updateで最新版に更新
- ソース: TechCrunch
GitHub Copilot
- 概要: GPT-5.4をCopilot
Pro/Pro+/Business/Enterpriseユーザーに提供開始。Plan
Modeのメトリクス追跡が可能に
- 主な更新:
- GPT-5 miniおよびGPT-4.1がプレミアムリクエスト消費なしで利用可能
- Copilot CLIが1.0 GA到達、Dev Container Featureとして利用可能
web_fetchツール追加(URL先コンテンツをMarkdownとして取得)
- 自動コンパクション(トークン上限95%到達時に履歴を自動圧縮)
- ソース: GitHub
Blog
Gemini Code Assist
- 概要: エージェントモードが全ユーザーに一般提供開始。Gemini 3
Pro/Flash対応
- 主な更新:
- エージェントモードがInsiders Channel不要に
- IDEリスタート間でエージェントモード・チャット状態が永続化
- GitHub上のGemini Code Assistに永続メモリ機能追加
- Tool Calling API → MCPへの移行期限が2026年3月(今月中)
- ソース: Google
Developers
その他の動向
- マルチエージェント開発が標準化:
2026年2月に主要ツール(Grok Build 8エージェント、Windsurf 5並列、Claude
Code Agent Teams、Codex CLI Agents
SDK、Devin並列セッション)が一斉にマルチエージェント対応を発表。並列エージェント実行はもはや前提機能
- Windsurf: Cognition AI買収後もLogRocket AI Dev
Toolランキング1位を維持。「Vibe and
Replace」(AI駆動の検索置換)を新搭載
- Claude Opus 4.6: SWE-bench
Verified約80%を達成し、実タスクでの最高性能を維持
- GPT-5.3-Codex: Terminal-Bench
2.0で77%を記録、CLIワークフローに特化した最高性能
- RecordPoint:
エンタープライズ向けMCPサーバーを公開。AI
AgentにガバナンスされたデータをMCP経由で安全に公開
- 開発者の役割変化: Forresterが「Agentic Software
Development(ASD)」を定義。エンジニアは「コード作成者」から「AIエージェントのオーケストレーター」へ移行中
Sources