Claude CodeでAIが自らコードを修正しブラウザ操作する時代、エンジニアが次に備えるべき設計術
AIが「操作」を捨てて「プログラミング」を始めた日 AIエージェントの進化がエンジニアの領域に踏み込んでいる。 これまでのAIはブラウザ画面を見てクリック指示を出す存在だった。 その時代は終わった。 最新の研究では、AIが自らPlaywrightのコードを書き、ターミナルからブラウザを制御し、エラーが出ればその場でデバッグして修正する。
SNS運用・プログラミング・IT活用に関する情報を発信しています。
AIが「操作」を捨てて「プログラミング」を始めた日 AIエージェントの進化がエンジニアの領域に踏み込んでいる。 これまでのAIはブラウザ画面を見てクリック指示を出す存在だった。 その時代は終わった。 最新の研究では、AIが自らPlaywrightのコードを書き、ターミナルからブラウザを制御し、エラーが出ればその場でデバッグして修正する。
2026年、開発の常識が音を立てて崩れている SWE-bench Verifiedで87.6%という数字。 開発者なら背筋が凍るはずだ。 ギブハブのイシューのほとんどをAIが自律的に解決できる時代が来ている。 開発者が一行ずつコードを書く時代は終わり、AIエージェントを指揮するアーキテクトへの転換が始まっている。 100回以上の改善ループをAIが自律的に回し、性能を30%向上させる。
開発環境が「AIチャット」から「統合プラットフォーム」へ進化した Cursor 3.8がリリースされた。今回のアップデートでAI開発環境は単一モデルの利用からワークフローの統合プラットフォームへと移行する。 これまで開発者はChatGPTやClaudeの画面を行き来してコードをコピペしていた。これからは開発資産やルール、外部ツールを接続するカスタマイズ可能なハブが開発の基盤となる。
AI開発の前提が変化。性能より「速度と統合」の時代へ 4倍の出力速度。50%のコスト削減。1日1兆トークンの処理能力。 これが新しい開発の基準だ。 単にAIが賢くなったのではない。 開発者がAIエージェントをOSレベルで使いこなすフェーズに突入した。 モデルの性能向上を待つ時間は終わった。 これからは複数のエージェントをどう繋ぎ、どう自律させるか。 その設計思想がプロダクトの成否を決める。
2026年、AIは単なるチャットツールから「自律的に動くエージェント」へと進化した。その中心にあるのが、Anthropicが提唱したMCP(Model Context Protocol)と、強力なCLIツールであるClaude Codeだ。 「AIに何を頼めばいいかわからない」「結局どれが一番仕事に使えるのか」という悩みを持つ人は多い。
Claude Codeの精度が上がらない原因のほとんどはモデルの性能不足ではない。プロジェクト環境の汚染だ。AIに良かれと思って詰め込んだ指示やツールが、逆にClaudeの脳内リソースを奪っている事実に気づく必要がある。 1人でSaaS開発を進める中で辿り着いた結論は、AIを無理に制御するのではなく、AIが迷子にならないための道標を整えることだ。これをハーネスエンジニアリングと呼ぶ。
コンテキスト18パーセントの衝撃。AIが「嘘」を信じ始める瞬間 コンテキスト使用率18パーセント。 まだ余裕がある。 それなのに、AIエージェントが「せん妄」を起こす。 やってもいない処理を「成功した」とログに書き、存在しない外部攻撃に怯え、送られてもいないユーザーの発言を捏造して一人で会話を始める。 これは「容量不足」の話ではない。 「記憶の汚染」という、開発者が直面する新しい壁だ。
GitHub Copilotの黄金時代が一つの節目を迎えた。これまで月額固定で使い放題だったプランが、トークン消費量に応じた従量課金制へと移行した。この変更により、これまで通りに開発を続けているだけで、月額料金が数倍から数十倍に跳ね上がるケースが続出している。