LLM × AI駆動開発デイリーリサーチ（2026-02-17）

主要アップデート

OpenAI GPT-5.3-Codex リリース（2/5）& GPT-5.3-Codex-Spark（2/12）: GPT-5.3-Codexは「開発者がコンピュータ上で行えることのほぼすべてを実行できるエージェント」へ進化。25%高速化。Sparkは1,000トークン/秒超のリアルタイムコーディングモデル。サイバーセキュリティリスクが「High」評価となり、安全対策も強化。
Claude Code Agent Teams（研究プレビュー）: 複数のClaude Codeインスタンスが並列で協調作業するマルチエージェント機能。リードセッションがタスク分配・統合を行い、チームメンバーは独立して作業可能。
Windsurf Codemaps（1/21）: Cognition AI（Devin）がWindsurfを買収後初の大型機能。SWE-1.5とClaude Sonnet 4.5によるAI注釈付きコード構造マップを生成。

詳細

OpenAI Codex / GPT-5.3-Codex

概要: GPT-5.2-Codexの後継。SWE-Bench ProとTerminal-Bench 2.0で最高性能を達成。コーディング性能と推論・専門知識能力を統合し、25%高速化
開発者への影響: コード生成・レビューだけでなく、コンピュータ上のほぼあらゆるタスクを自律的に実行可能。長時間タスク（7時間超の連続作業実績あり）に対応
GPT-5.3-Codex-Spark: 1,000トークン/秒超のリアルタイム応答。軽量版として即時性が求められるユースケースに最適
安全性: OpenAI初の「High」サイバーセキュリティリスク評価。自動監視、信頼済みアクセス制御、脅威インテリジェンス連携を導入
利用: ChatGPT有料プラン（Plus/Pro/Business/Enterprise）で利用可能。API は段階的に公開中
ソース: Introducing GPT-5.3-Codex

Claude Code 2.1 / Agent Teams

概要: Agent Teams機能がresearch previewとして追加。1つのリードセッションが複数のチームメイトセッションを統括し、並列でタスクを実行
開発者への影響: 研究・レビュー、新モジュール開発、デバッグ仮説の並列検証、フロントエンド/バックエンド/テストの横断変更に有効
設定方法: CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 環境変数を設定後、Claude Codeでチーム構成を自然言語で指示
注意: トークン消費が大きい（プランモードで約10k、方向を誤ったチームで500k+）
その他の新機能:
- Claude Opus 4.6のFast Mode対応
- 起動性能改善（Zodスキーマ構築の遅延化）
- プロンプトキャッシュヒット率の改善
- ネストセッションガードの追加
- /resume XMLプレビューの改善
ソース: Claude Code Agent Teams Docs

Cursor 2.0

概要: Composerモデル搭載のエージェント中心インターフェース。複数エージェントの並列実行・管理が可能に
Background Agents: エージェントがバックグラウンドで自律的にタスクを実行。OS通知で完了を通知
BugBot: GitHub連携のデバッグアシスタント。PR単位のバグ解決率が2倍以上に向上（解決率52%→70%超）
Memories: プロジェクトコンテキストを永続的に記憶。セッション間で知識を保持
Hooks（ベータ）: エージェント動作を実行時に制御するカスタムスクリプト
Team Rules: 組織全体のグローバルポリシー定義
市場: ARR 5億ドル突破、評価額100億ドル。Fortune 500の半数以上が利用
ソース: Cursor 2.0

GitHub Copilot

概要: Agent Modeが全VS Codeユーザーに展開。JetBrains、Eclipse、Xcodeにも拡大（パブリックプレビュー）
新モデル: GPT-5.1-Codex-Max、Claude Opus 4.5、Gemini 3 Proが利用可能に
Coding Agent: GitHubイシューをCopilotに割り当て、自律的にPRを作成する機能
Vision: スクリーンショットやモックアップからUIコードを自動生成
Next Edit Suggestions: 次の論理的な編集を自動予測・提案
性能: 2025年9月以降、スループット2倍、検索精度37.6%向上、インデックスサイズ1/8
ソース: GitHub Copilot What’s New

Windsurf（Cognition AI）

概要: 2025年12月にCognition AI（Devin開発元）が買収。WindsurfのIDEとDevinの自律コーディング能力の統合を推進
Codemaps（1/21）: SWE-1.5とClaude Sonnet 4.5によるAI注釈付きコード構造マップ。コードベースの全体像を可視化
新モデル: GPT-5.1、Claude Opus 4.5、Gemini 3 Flash、GLM-5等に対応
Cascade改善: 自動プランニングモード、長コンテキストモデル活用のコード探索強化
Vibe and Replace: AI駆動のFind & Replace。複数のコード箇所にインテリジェントな変換を適用
ソース: Windsurf Codemaps

Devin（Cognition AI）

概要: Devin Reviewを1/22にリリース。AIによるコードレビューツール
Devin Review: diff解析によるバグ検出（赤=バグ可能性大、黄=警告、灰=情報）、論理的なdiffグルーピング、インタラクティブチャット
Infosys提携（1/7）: InfosysがDevinを社内エンジニアリングとクライアント納品に統合
価格: Devin 2.0で月額$20からの柔軟プランを導入（旧$500/月から大幅値下げ）
ソース: Devin Review

Gemini Code Assist

概要: 2025年10月にツールベースからAgent Mode（プレビュー）に完全移行
Agent Mode: VS Code（プレビュー）とIntelliJ（安定版）で利用可能。AIプラン、インラインdiff、リアルタイムシェル出力
MCP対応: Model Context Protocolサーバーへの接続をサポート。既存Tool Calling APIは2026年3月までにMCPへ移行必須
Next Edit Predictions: 現在編集中のファイル内で次のコード提案を予測（プレビュー）
無料枠: 180K無料補完（GitHub Copilot無料枠の90倍）
モデル: Gemini 2.5 Pro / 2.5 Flashが全ユーザーティアでGA
ソース: Gemini Code Assist Release Notes

JetBrains Junie

概要: JetBrainsのAIコーディングエージェント。AI AssistantとJunieが統合サブスクリプションモデルに移行（Free/Pro/Ultimate）
対応IDE: IntelliJ IDEA Ultimate、PyCharm Pro、WebStorm、GoLand、PhpStorm、RustRover、RubyMine、Android Studio
機能: タスクの自律的実行、プロジェクト探索、コンテキストに合ったコード生成、テスト実行
AI Chat統合: JunieがAI Assistantのチャット体験に完全統合
外部モデル: OpenAI、Anthropic、その他OpenAI互換プロバイダーのAPIキーを使用可能
ソース: JetBrains Junie

MCP（Model Context Protocol）

概要: 2025年11月にAnthropicがMCPをLinux Foundation配下のAgentic AI Foundation（AAIF）に寄贈。Anthropic、Block、OpenAIが共同設立
仕様更新（2025-11-25版）: Task抽象化（非同期タスク追跡）、OAuthリソースサーバー分類、RFC 8707準拠のリソースインジケーター必須化
エコシステム: MCP Registryのサーバー数が約2,000件に到達（407%成長）
エンタープライズ: Google（Maps、BigQuery、Compute Engine、GKE）、Microsoft（Dynamics 365 ERP）がマネージドMCPサーバーを提供
Agent-to-Agent Protocol（A2A）: GoogleがMCPと併用するエージェント間通信プロトコルを推進
ソース: MCP Specification

その他の動向

マルチエージェントシステムへの関心急増: Gartnerによると、マルチエージェントシステムに関する問い合わせが2024年Q1→2025年Q2で1,445%増加。2027年までに70%のマルチエージェントシステムが狭い専門領域に特化した役割を持つと予測
AI駆動開発の市場規模: エージェンティックAI市場は現在78億ドル→2030年に520億ドル超と予測。2026年末までにエンタープライズアプリの40%がAIエージェントを内蔵（Gartner予測、2025年は5%未満）
オープンソースAIコーディングエージェント: Clineが実用的なオープンソースコーディングエージェントとしてVS Code上で注目。Plan Mode、MCP統合、ターミナルファーストのワークフローを提供
LLMコーディングベンチマーク: 2026年1月時点でGPT-5.2（xhigh）がLiveCodeBenchで89%、オープンソースではGLM-4.7 Thinkingが同等性能を無料で提供（MITライセンス）
Anthropic社内での活用: Claude Codeのコードの約90%がClaude Code自身によって書かれている

LLM × AI駆動開発 デイリーリサーチ（2026-02-17）

主要アップデート

詳細

OpenAI Codex / GPT-5.3-Codex

Claude Code 2.1 / Agent Teams

Cursor 2.0

GitHub Copilot

Windsurf（Cognition AI）

Devin（Cognition AI）

Gemini Code Assist

JetBrains Junie

MCP（Model Context Protocol）

その他の動向

Sources

LLM × AI駆動開発デイリーリサーチ（2026-02-17）