LLM × AI駆動開発デイリーリサーチ（2026-03-07）

主要アップデート

OpenAI GPT-5.4リリース（3/5）: ネイティブComputer Use対応、1Mトークンコンテキストウィンドウ、SWE-Bench Pro 57.7%を達成するOpenAI史上最高性能モデル
Cursor Automations発表（3/5）: イベント駆動型のAIコーディングエージェント自動実行プラットフォーム。Slack・GitHub・PagerDuty等のトリガーに対応
OpenAI Codex Security公開（3/6）: AIベースの脆弱性スキャナー。120万コミットをスキャンし、10,561件の高深刻度脆弱性を検出。リサーチプレビューとして提供開始

概要: イベント駆動型でAIコーディングエージェントを自動起動するプラットフォーム。「prompt-and-monitor」型からの脱却を目指す
主な機能:
- トリガー: Slack、GitHub、PagerDuty、Linear、Webhook、タイマー
- ユースケース: セキュリティ監査、バグ検出、インシデント対応、週次コードベースサマリー
- 実績: 毎時数百のオートメーションが実行中
開発者への影響: エンジニアはポリシー定義に集中し、エージェントが定常タスクを自律実行。人間は必要な判断ポイントでのみ介入
ソース: TechCrunch

概要: AIベースの脆弱性検出・検証・パッチ提案エージェント。内部ツール「Aardvark」の進化版
主な実績:
- 120万コミットをスキャン、792件のクリティカル・10,561件の高深刻度の脆弱性を検出
- 偽陽性率が50%以上低減（一部リポジトリでは84%低減）
- OpenSSH、GnuTLS、PHP、Chromium等のOSSで14件のCVEを発見
利用条件: ChatGPT Pro/Enterprise/Business/Eduユーザー向け、Codex Web経由で1ヶ月無料
開発者への影響: CI/CDパイプラインに組み込むことで、コミット単位の自動セキュリティ監査が可能
ソース: The Hacker News

概要: GPT-5.4をCopilot Pro/Pro+/Business/Enterpriseユーザーに提供開始。Plan Modeのメトリクス追跡が可能に
主な更新:
- GPT-5 miniおよびGPT-4.1がプレミアムリクエスト消費なしで利用可能
- Copilot CLIが1.0 GA到達、Dev Container Featureとして利用可能
- web_fetchツール追加（URL先コンテンツをMarkdownとして取得）
- 自動コンパクション（トークン上限95%到達時に履歴を自動圧縮）
ソース: GitHub Blog

概要: エージェントモードが全ユーザーに一般提供開始。Gemini 3 Pro/Flash対応
主な更新:
- エージェントモードがInsiders Channel不要に
- IDEリスタート間でエージェントモード・チャット状態が永続化
- GitHub上のGemini Code Assistに永続メモリ機能追加
- Tool Calling API → MCPへの移行期限が2026年3月（今月中）
ソース: Google Developers

マルチエージェント開発が標準化: 2026年2月に主要ツール（Grok Build 8エージェント、Windsurf 5並列、Claude Code Agent Teams、Codex CLI Agents SDK、Devin並列セッション）が一斉にマルチエージェント対応を発表。並列エージェント実行はもはや前提機能
Windsurf: Cognition AI買収後もLogRocket AI Dev Toolランキング1位を維持。「Vibe and Replace」（AI駆動の検索置換）を新搭載
Claude Opus 4.6: SWE-bench Verified約80%を達成し、実タスクでの最高性能を維持
GPT-5.3-Codex: Terminal-Bench 2.0で77%を記録、CLIワークフローに特化した最高性能
RecordPoint: エンタープライズ向けMCPサーバーを公開。AI AgentにガバナンスされたデータをMCP経由で安全に公開
開発者の役割変化: Forresterが「Agentic Software Development（ASD）」を定義。エンジニアは「コード作成者」から「AIエージェントのオーケストレーター」へ移行中