しんたろーのITアカデミー
AI活用Tips

Claude Codeがセッション管理を強化。記憶保持でAI開発の無駄が消える理由

Claude Codeがセッション管理を強化。記憶保持でAI開発の無駄が消える理由
しんたろーしんたろー
11分で読めます
この記事の内容(目次)

SNS運用を自動化しませんか?

ThreadPostなら、投稿作成・画像生成・スケジュール管理までAIがサポート。

無料で始める

AIが「毎朝記憶を消される」状態で働いていた

AIエージェントにバグを直させると、同じ修正を繰り返す。

各リトライがステートレスだからだ。

ある検証では、170回のAI呼び出しのうち100回——59%——が同じ壁にぶつかるだけの無駄なリトライだった。

合計23時間のうち約13時間が「AIが同じ間違いを繰り返す時間」だ。

Claude Codeの最新アップデートは、この構造的な問題に対応している。

セッション管理の強化とプロンプトキャッシュのTTL制御が実装された。

AIエージェントの無駄なリトライ率
AIエージェントの無駄なリトライ率

Claude Code最新アップデートの全体像

今回のアップデートで追加・変更された機能を整理する。

セッション管理:

  • 「/recap」機能の追加 — セッションに戻ったとき、過去の作業コンテキストを要約して提供する。「/config」で設定可能。「CLAUDE_CODE_ENABLE_AWAY_SUMMARY」環境変数でテレメトリ無効環境でも強制起動できる
  • 「/resume」ピッカーの改善 — デフォルトで現在のディレクトリのセッションを優先表示。「Ctrl+A」で全プロジェクトを表示切り替え
  • 「/undo」が「/rewind」のエイリアスに
  • セッション名・カラーの保持バグ修正

プロンプトキャッシュ:

  • 「ENABLE_PROMPT_CACHING_1H」環境変数の追加 — API Key、Bedrock、Vertex、Foundryで1時間のプロンプトキャッシュTTLをオプトイン可能に
  • 「FORCE_PROMPT_CACHING_5M」の追加 — キャッシュを5分TTLに強制する環境変数
  • テレメトリ無効ユーザーが誤って5分TTLにフォールバックしていたバグを修正

スキル・コマンド:

  • Skillツール経由でビルトインスラッシュコマンドを自動発見・実行 — 「/init」「/review」「/security-review」をモデルが自律的に呼び出せるようになった
  • 「/model」切り替え時の警告追加 — 会話途中でモデルを変えると全履歴がキャッシュなしで再読み込みされるコスト警告を表示
  • EnterWorktreeツールにpathパラメータ追加

その他の改善:

  • エラーメッセージの強化(サーバーレート制限とプラン上限を区別表示)
  • ファイル読み込み・編集・シンタックスハイライトのメモリ使用量削減
  • 発音記号がレスポンスから消えるバグの修正
※この記事は、Claude Codeで1人SaaS開発しているしんたろーが、海外AI最新情報を開発者目線で解説する「AI活用Tips」です。
しんたろーしんたろー:
「/recap」を見た瞬間、これが欲しかった機能だと思った。
翌朝Claude Codeを開いて「昨日どこまでやったっけ」と確認する時間が積み上がっていたからだ。
セッション管理の進化:従来と最新の比較
セッション管理の進化:従来と最新の比較

「AIの記憶喪失」という構造問題

Claude Codeのアップデートの中で、「/recap」と「ENABLE_PROMPT_CACHING_1H」は開発効率に直結する。

AIエージェントは「毎朝記憶を消されるデバッガー」だった

あるベンチマークでの検証データがある。

73問のバグ修正を全問正解した。

問題の難易度が高いP3カテゴリでは、1問に平均12.3回のリトライが発生した。

6問で合計74回のAI呼び出しが行われている。

ログには以下のパターンが頻出する。

  • 1回目: ファイルAの関数Xを修正 → 失敗
  • 2回目: ファイルAの関数Xを修正 → 失敗
  • 3回目: ファイルAの関数Xを修正 → 失敗
  • 4回目: ファイルAの関数Yを修正 → 失敗
  • 5回目: ファイルAの関数Xを修正 → 再度失敗

各リトライがステートレスであるためだ。

AIは毎回、白紙の状態でバグに向き合う。

患者のカルテを持たずに毎回初診から始める医者と同じ状態だ。

「診断を先に書かせる」だけで59%の無駄が消えた

プロンプトに「まず診断しろ」の1ステップを強制する。

修正を始める前に、AIに以下を書かせる。

  • 根本原因は何か
  • 責任のあるファイルと行はどこか
  • 正しい挙動は何か

これだけで59%の無駄なリトライが消えた。

診断結果を次のリトライに引き継ぐ仕組みを実装すると、AIは前回失敗したアプローチを回避できる。

Claude Codeの「/recap」はこの問題のネイティブ解

「/recap」はセッションに戻ったとき、過去の作業コンテキストを要約して提供する。

Claude Codeがセッション間のコンテキスト継続をネイティブに管理する仕組みだ。

「ENABLE_PROMPT_CACHING_1H」も同様だ。

1時間のキャッシュTTLによってトークンコストを削減できる。

「/model」切り替え時の警告も、キャッシュの消失を防ぐために重要だ。

MCPとの組み合わせで「自律的なデバッガー」になる

MCP(Model Context Protocol)はクライアントとサーバーの両方に状態と責務を持つ仕組みだ。

Claude CodeのSkillツールがビルトインスラッシュコマンドを自律的に発見・実行できるようになったのは、capability宣言の仕組みを活用した進化だ。

しんたろーしんたろー:
「診断を先に書かせる」のプロンプト設計は、ThreadPost開発でも感覚的に行っていたが、59%という数字を見て設計の重要性を再確認した。
「まず何が起きてるか言語化させる」ステップをスキップすると、AIはすぐメスを握りに行く。
プロンプトキャッシュTTL制御の使い分け
プロンプトキャッシュTTL制御の使い分け

ここまで読んだあなたに

今なら無料で全機能をお試しいただけます。設定後はAIが投稿案を毎日生成。確認して選ぶだけ。

無料で始める

実務への影響

1. 「ENABLE_PROMPT_CACHING_1H」を設定する

Claude Codeを長いセッションで使う場合、この環境変数を設定する。

1時間TTLのプロンプトキャッシュにより、頻繁なツール呼び出し時のトークンコストが下がる。

ファイル構成が頻繁に変わるフェーズでは、「FORCE_PROMPT_CACHING_5M」で5分TTLに強制する。

2. 「/recap」をセッション再開のルーティンに組み込む

セッションを再開するとき、「/recap」を最初に叩く。

「昨日どこまでやったっけ」の確認コストがゼロに近づく。

「CLAUDE_CODE_ENABLE_AWAY_SUMMARY」環境変数を設定すると、テレメトリ無効環境でも強制的に有効にできる。

3. プロンプトに「診断ステップ」を組み込む

AIエージェントにコード修正を任せるなら「まず診断を書かせる」プロンプト設計を行う。

  • 「修正を始める前に、根本原因・責任ファイル・正しい挙動を「## Diagnosis」セクションとして書いてください」
  • 「前回の試みで何を試して、なぜ失敗したかを先に整理してください」

この2行を追加するだけで、リトライの無駄が減る。

4. 「/model」切り替えのコストを意識する

会話の途中でモデルを変えると、次のレスポンスで全履歴がキャッシュなしで再読み込みされる。

長いコンテキストを積み上げたセッションで不用意にモデルを切り替えると、トークンコストが跳ね上がる。

5. MCPサーバーを自作・拡張するなら「capability」を意識する

MCPを「ツール呼び出しAPI」として実装すると、後から詰まる。

サーバー側がcapabilityを宣言し、クライアント側がそれに応答する実装を持っていないと、エージェントは正しく動作しない。

生のJSON-RPC通信を可視化するツールで初期化シーケンスを確認する。

しんたろーしんたろー:
「/model切り替えでキャッシュが全部パーになる」ことは多くの人が見落としがちだ。
長いセッションの途中でモデルを試したくなるが、コスト的には新しいセッションを立ち上げた方がいいケースが多い。

FAQ

Q1. AIエージェントが同じ修正を繰り返すのを防ぐには?

AIをステートレスに動かさないことが重要だ。

Claude Codeを使っているなら、セッション管理機能と「/recap」を活用して、過去の試行錯誤をコンテキストとして保持させる。

自作エージェントの場合は、「カルテ(SessionState)」の仕組みを実装する。

過去の失敗と診断結果をリスト形式でプロンプトの先頭に挿入し、「DO NOT repeat these — try a different approach」という明示的な指示を入れる。

Q2. Claude Codeのプロンプトキャッシュ設定はどう使い分けるべき?

基本は「ENABLE_PROMPT_CACHING_1H」を設定しておく。

長いセッションや頻繁なツール呼び出し時のトークンコストを削減できる。

ファイル構成が頻繁に変わる開発フェーズでは、キャッシュが古い状態のコードをAIが参照し続ける可能性があるため、「FORCE_PROMPT_CACHING_5M」で5分TTLに強制する。

「/model」切り替えはキャッシュをすべて無効化することも覚えておく。

Q3. MCPサーバーを自作する際、何に注意すべき?

MCPを「単なるツール呼び出しAPI」だと思って実装すると後から詰まる。

MCPは初期化時にクライアントとサーバーが互いに「capability(能力)」を宣言するプロトコルだ。

特に漏れやすいのが、サーバーからクライアントへのリクエストへの応答だ。

公式のInspectorだけでなく、生のJSON-RPC通信を可視化するツールで初期化シーケンスを確認する。


まとめ

「AIが同じ間違いを繰り返す」の正体は、ステートレスなリトライだ。

Claude Codeの「/recap」とプロンプトキャッシュTTL制御は、この構造問題に対するインフラレベルの回答だ。

「診断を先に書かせる」プロンプト設計と組み合わせると、APIコストと開発時間の両方が削れる。

セッション管理を意識したアーキテクチャ設計を推奨する。

👉 ThreadPostでSNS運用を自動化する

ThreadPost — SNS投稿をAIが自動化

この記事が参考になったら、ThreadPostを試してみませんか?投稿作成・画像生成・スケジュール管理まで、AIがサポートします。

無料で始める

この記事をシェア

XはてブLINE
しんたろー

ThreadPost開発者・個人開発エンジニア

AI × SaaS個人開発者。Cursor / Claude Code を使った効率的開発、SNS自動化について実体験から発信。

人気の記事