LLM × AI駆動開発 デイリーリサーチ(2026-02-17)
主要アップデート
- OpenAI GPT-5.3-Codex リリース(2/5)& GPT-5.3-Codex-Spark(2/12): GPT-5.3-Codexは「開発者がコンピュータ上で行えることのほぼすべてを実行できるエージェント」へ進化。25%高速化。Sparkは1,000トークン/秒超のリアルタイムコーディングモデル。サイバーセキュリティリスクが「High」評価となり、安全対策も強化。
- Claude Code Agent Teams(研究プレビュー): 複数のClaude Codeインスタンスが並列で協調作業するマルチエージェント機能。リードセッションがタスク分配・統合を行い、チームメンバーは独立して作業可能。
- Windsurf Codemaps(1/21): Cognition AI(Devin)がWindsurfを買収後初の大型機能。SWE-1.5とClaude Sonnet 4.5によるAI注釈付きコード構造マップを生成。
詳細
OpenAI Codex / GPT-5.3-Codex
- 概要: GPT-5.2-Codexの後継。SWE-Bench ProとTerminal-Bench 2.0で最高性能を達成。コーディング性能と推論・専門知識能力を統合し、25%高速化
- 開発者への影響: コード生成・レビューだけでなく、コンピュータ上のほぼあらゆるタスクを自律的に実行可能。長時間タスク(7時間超の連続作業実績あり)に対応
- GPT-5.3-Codex-Spark: 1,000トークン/秒超のリアルタイム応答。軽量版として即時性が求められるユースケースに最適
- 安全性: OpenAI初の「High」サイバーセキュリティリスク評価。自動監視、信頼済みアクセス制御、脅威インテリジェンス連携を導入
- 利用: ChatGPT有料プラン(Plus/Pro/Business/Enterprise)で利用可能。API は段階的に公開中
- ソース: Introducing GPT-5.3-Codex
Claude Code 2.1 / Agent Teams
- 概要: Agent Teams機能がresearch previewとして追加。1つのリードセッションが複数のチームメイトセッションを統括し、並列でタスクを実行
- 開発者への影響: 研究・レビュー、新モジュール開発、デバッグ仮説の並列検証、フロントエンド/バックエンド/テストの横断変更に有効
- 設定方法:
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 環境変数を設定後、Claude Codeでチーム構成を自然言語で指示
- 注意: トークン消費が大きい(プランモードで約10k、方向を誤ったチームで500k+)
- その他の新機能:
- Claude Opus 4.6のFast Mode対応
- 起動性能改善(Zodスキーマ構築の遅延化)
- プロンプトキャッシュヒット率の改善
- ネストセッションガードの追加
/resume XMLプレビューの改善
- ソース: Claude Code Agent Teams Docs
Cursor 2.0
- 概要: Composerモデル搭載のエージェント中心インターフェース。複数エージェントの並列実行・管理が可能に
- Background Agents: エージェントがバックグラウンドで自律的にタスクを実行。OS通知で完了を通知
- BugBot: GitHub連携のデバッグアシスタント。PR単位のバグ解決率が2倍以上に向上(解決率52%→70%超)
- Memories: プロジェクトコンテキストを永続的に記憶。セッション間で知識を保持
- Hooks(ベータ): エージェント動作を実行時に制御するカスタムスクリプト
- Team Rules: 組織全体のグローバルポリシー定義
- 市場: ARR 5億ドル突破、評価額100億ドル。Fortune 500の半数以上が利用
- ソース: Cursor 2.0
GitHub Copilot
- 概要: Agent Modeが全VS Codeユーザーに展開。JetBrains、Eclipse、Xcodeにも拡大(パブリックプレビュー)
- 新モデル: GPT-5.1-Codex-Max、Claude Opus 4.5、Gemini 3 Proが利用可能に
- Coding Agent: GitHubイシューをCopilotに割り当て、自律的にPRを作成する機能
- Vision: スクリーンショットやモックアップからUIコードを自動生成
- Next Edit Suggestions: 次の論理的な編集を自動予測・提案
- 性能: 2025年9月以降、スループット2倍、検索精度37.6%向上、インデックスサイズ1/8
- ソース: GitHub Copilot What’s New
Windsurf(Cognition AI)
- 概要: 2025年12月にCognition AI(Devin開発元)が買収。WindsurfのIDEとDevinの自律コーディング能力の統合を推進
- Codemaps(1/21): SWE-1.5とClaude Sonnet 4.5によるAI注釈付きコード構造マップ。コードベースの全体像を可視化
- 新モデル: GPT-5.1、Claude Opus 4.5、Gemini 3 Flash、GLM-5等に対応
- Cascade改善: 自動プランニングモード、長コンテキストモデル活用のコード探索強化
- Vibe and Replace: AI駆動のFind & Replace。複数のコード箇所にインテリジェントな変換を適用
- ソース: Windsurf Codemaps
Devin(Cognition AI)
- 概要: Devin Reviewを1/22にリリース。AIによるコードレビューツール
- Devin Review: diff解析によるバグ検出(赤=バグ可能性大、黄=警告、灰=情報)、論理的なdiffグルーピング、インタラクティブチャット
- Infosys提携(1/7): InfosysがDevinを社内エンジニアリングとクライアント納品に統合
- 価格: Devin 2.0で月額$20からの柔軟プランを導入(旧$500/月から大幅値下げ)
- ソース: Devin Review
Gemini Code Assist
- 概要: 2025年10月にツールベースからAgent Mode(プレビュー)に完全移行
- Agent Mode: VS Code(プレビュー)とIntelliJ(安定版)で利用可能。AIプラン、インラインdiff、リアルタイムシェル出力
- MCP対応: Model Context Protocolサーバーへの接続をサポート。既存Tool Calling APIは2026年3月までにMCPへ移行必須
- Next Edit Predictions: 現在編集中のファイル内で次のコード提案を予測(プレビュー)
- 無料枠: 180K無料補完(GitHub Copilot無料枠の90倍)
- モデル: Gemini 2.5 Pro / 2.5 Flashが全ユーザーティアでGA
- ソース: Gemini Code Assist Release Notes
JetBrains Junie
- 概要: JetBrainsのAIコーディングエージェント。AI AssistantとJunieが統合サブスクリプションモデルに移行(Free/Pro/Ultimate)
- 対応IDE: IntelliJ IDEA Ultimate、PyCharm Pro、WebStorm、GoLand、PhpStorm、RustRover、RubyMine、Android Studio
- 機能: タスクの自律的実行、プロジェクト探索、コンテキストに合ったコード生成、テスト実行
- AI Chat統合: JunieがAI Assistantのチャット体験に完全統合
- 外部モデル: OpenAI、Anthropic、その他OpenAI互換プロバイダーのAPIキーを使用可能
- ソース: JetBrains Junie
MCP(Model Context Protocol)
- 概要: 2025年11月にAnthropicがMCPをLinux Foundation配下のAgentic AI Foundation(AAIF)に寄贈。Anthropic、Block、OpenAIが共同設立
- 仕様更新(2025-11-25版): Task抽象化(非同期タスク追跡)、OAuthリソースサーバー分類、RFC 8707準拠のリソースインジケーター必須化
- エコシステム: MCP Registryのサーバー数が約2,000件に到達(407%成長)
- エンタープライズ: Google(Maps、BigQuery、Compute Engine、GKE)、Microsoft(Dynamics 365 ERP)がマネージドMCPサーバーを提供
- Agent-to-Agent Protocol(A2A): GoogleがMCPと併用するエージェント間通信プロトコルを推進
- ソース: MCP Specification
その他の動向
- マルチエージェントシステムへの関心急増: Gartnerによると、マルチエージェントシステムに関する問い合わせが2024年Q1→2025年Q2で1,445%増加。2027年までに70%のマルチエージェントシステムが狭い専門領域に特化した役割を持つと予測
- AI駆動開発の市場規模: エージェンティックAI市場は現在78億ドル→2030年に520億ドル超と予測。2026年末までにエンタープライズアプリの40%がAIエージェントを内蔵(Gartner予測、2025年は5%未満)
- オープンソースAIコーディングエージェント: Clineが実用的なオープンソースコーディングエージェントとしてVS Code上で注目。Plan Mode、MCP統合、ターミナルファーストのワークフローを提供
- LLMコーディングベンチマーク: 2026年1月時点でGPT-5.2(xhigh)がLiveCodeBenchで89%、オープンソースではGLM-4.7 Thinkingが同等性能を無料で提供(MITライセンス)
- Anthropic社内での活用: Claude Codeのコードの約90%がClaude Code自身によって書かれている
Sources