記事一覧へ
おい、Claude Codeの「記憶管理」の仕組みが流出コードから判明した。これはClaude Code使ってる人全員読んだ方がいい。
「Claudeが忘れた」って経験、みんなあるよね。あれの正体がコードレベルで解明された。
①3層の記憶圧縮パイプライン
第1層: MicroCompact(毎ターン実行、超安価)
・全てのAPIリクエスト前に実行
・ツール結果の不要部分を削除してトークン節約
・会話構造自体は変えない
第2層: Session Memory Compact(中程度、APIコール不要)
・セッションメモリファイルから文脈を再構築
・モデルへのAPIコールが不要 → 安い
・これが失敗した場合のみ第3層に進む
第3層: Legacy Compact(高コスト、完全要約)
・Claudeに「今までの会話を要約して」と依頼
・元の会話記録は削除しない(上書きしない)
②最も賢い設計: preserved-tail relinking
・要約後も「直近のメッセージの尾部」を保存
・再開時にこの尾部を要約チェーンにリンクし直す
→ 「今まさに作業してるコンテキスト」を極力維持する設計
③「Claudeが忘れた」の正体
・実際にはメッセージを削除してない
・境界切断 + 要約置換 + 尾部保存が組み合わさった結果
・設計上は「忘れない」ように最大限努力してるが、トークン制限との戦い
ちなみにこの仕組みを知ってると、Claude Codeの使い方が変わる。長い会話を続けるより、重要なコンテキストはCLAUDE.mdやセッションメモリに書き出す方が確実。
みんなは「Claudeが忘れた」問題、困ってる?

claude-setupAIClaudeClaude Codeharness-design
Claude Codeの「記憶管理」の仕組みが流出コードから判明 — 3層圧縮パイプライン
♥ 1,209↻ 179
原文を表示 / Show original
おい、Claude Codeの「記憶管理」の仕組みが流出コードから判明した。これはClaude Code使ってる人全員読んだ方がいい。
「Claudeが忘れた」って経験、みんなあるよね。あれの正体がコードレベルで解明された。
①3層の記憶圧縮パイプライン
第1層: MicroCompact(毎ターン実行、超安価)
・全てのAPIリクエスト前に実行
・ツール結果の不要部分を削除してトークン節約
・会話構造自体は変えない
第2層: Session Memory Compact(中程度、APIコール不要)
・セッションメモリファイルから文脈を再構築
・モデルへのAPIコールが不要 → 安い
・これが失敗した場合のみ第3層に進む
第3層: Legacy Compact(高コスト、完全要約)
・Claudeに「今までの会話を要約して」と依頼
・元の会話記録は削除しない(上書きしない)
②最も賢い設計: preserved-tail relinking
・要約後も「直近のメッセージの尾部」を保存
・再開時にこの尾部を要約チェーンにリンクし直す
→ 「今まさに作業してるコンテキスト」を極力維持する設計
③「Claudeが忘れた」の正体
・実際にはメッセージを削除してない
・境界切断 + 要約置換 + 尾部保存が組み合わさった結果
・設計上は「忘れない」ように最大限努力してるが、トークン制限との戦い
ちなみにこの仕組みを知ってると、Claude Codeの使い方が変わる。長い会話を続けるより、重要なコンテキストはCLAUDE.mdやセッションメモリに書き出す方が確実。
みんなは「Claudeが忘れた」問題、困ってる?