メインコンテンツへスキップ
LLM × AI駆動開発
デイリーリサーチ(2025-05-25)
主要アップデート
- Anthropic Claude 4(Opus 4 / Sonnet 4)リリース & Claude
Code GA化(5/22): Claude Opus 4はSWE-bench
72.5%を達成し「世界最高のコーディングモデル」と位置づけ。Claude
Codeが正式GA化。
- GitHub Copilot コーディングエージェント
パブリックプレビュー(5/19): Microsoft Build 2025でGitHub
Issueを割り当てるだけで自律的にコードを書くエージェントを発表。
- OpenAI Codex リサーチプレビュー(5/16):
codex-1(o3ベース)を搭載したクラウドベースの自律コーディングエージェントをChatGPTに統合。
詳細
Anthropic Claude 4 / Claude
Code GA
- 概要: Claude Opus 4とClaude Sonnet 4を発表。Extended Thinking + Tool
Use(beta)により、思考中にツール呼び出しが可能に。Claude
CodeがGA化し、GitHub Actions経由のバックグラウンドタスク、VS
Code/JetBrains統合をサポート。
- 開発者への影響:
- Opus 4:
長時間エージェントタスクに最適。複数時間の連続作業が可能
- Sonnet 4: SWE-bench 72.7%で日常的なコーディング支援に最適
- 新API機能: コード実行ツール、MCPコネクタ、Files
API、1時間キャッシュ
- 設定方法: Claude Code は
npm install -g @anthropic-ai/claude-code
でインストール。モデル指定は claude --model claude-opus-4
で利用可能
- 料金: Opus 4 = 15/75 per 1M tokens
(input/output)、Sonnet 4 = 3/15
- ソース: https://www.anthropic.com/news/claude-4
GitHub Copilot
コーディングエージェント
- 概要: GitHub Issueを Copilot に割り当てると、GitHub
Actionsで安全なサンドボックス環境を起動し、自律的にコード変更・ドラフトPR作成まで行う
- 開発者への影響:
低〜中複雑度のタスク(機能追加、バグ修正、テスト拡張、リファクタリング)を非同期で委任可能。VS
Code、GitHub Mobile、GitHub CLIから利用可能
- 設定方法: Copilot Enterprise または Copilot Pro+
でリポジトリ設定から有効化。6/4以降はプレミアムリクエスト消費制に移行
- 補足: VS Code の Copilot Chat
拡張がMITライセンスでオープンソース化予定。Agent
ModeがJetBrains、Eclipse、Xcodeにも展開
- ソース: https://github.blog/changelog/2025-05-19-github-copilot-coding-agent-in-public-preview/
OpenAI
Codex(クラウドエージェント)
- 概要:
codex-1(o3の最適化版)を使用し、各タスクを独立したクラウドサンドボックスで実行。リポジトリをプリロードし、機能実装・バグ修正・PRの提案を1〜30分で完了
- 開発者への影響:
並列タスク実行が可能。人間のコードスタイルやPR慣例に従うよう強化学習で訓練済み。エアギャップ環境でセキュリティ確保
- 設定方法: ChatGPT
Pro/Enterprise/Teamプランで利用可能。ChatGPTサイドバーから「Code」または「Ask」をクリック
- ソース: https://openai.com/index/introducing-codex/
Windsurf SWE-1
モデルファミリー発表(5/15)
AWS MCP
サーバー公開(5/29予定)
Gemini Code Assist
アップデート
その他の動向
- Atlassian Remote MCP Server ベータ(5/1):
Jira/Confluenceの構造化データをAIツールからMCP経由で操作可能に
- Microsoft Build 2025 "Agentic DevOps":
マルチエージェントオーケストレーションの概念を提唱。エージェント同士が協調してDevOpsパイプラインを構成
- AI Coding 市場動向: Stack Overflow 2025 Developer
Surveyで65%の開発者がAIコーディングツールを週次利用。Claude
Code/Cursorが専用IDE市場で各18%シェア
- Cursor Composer 2.5:
長時間タスク・複雑な指示に対する信頼性向上モデル。Jira連携、Bugbot従量課金化(平均1.00−1.50/run)
Sources