あなたのハーネス、あなたのメモリ — エージェントハーネスとメモリの密接な関係

エージェントハーネスはエージェント構築の主流な方法になりつつあり、なくなることはありません。これらのハーネスはエージェントのメモリと密接に結びついています。クローズドなハーネスを使っている場合—特にプロプライエタリなAPIの後ろにある場合—エージェントのメモリのコントロールをサードパーティに委ねることを選択しています。メモリは優れた粘着性のあるエージェント体験を生み出すために非常に重要です。これは強力なロックインを生み出します。メモリ—そしてハーネス—はオープンであるべきで、そうすることで自分自身のメモリを所有できます。 ## エージェントハーネスはエージェントの構築方法であり、なくなることはないエージェントシステムを構築する「最良の」方法は、過去3年間で劇的に変化しました。ChatGPTが登場したとき、できることはシンプルなRAGチェーン（LangChain）だけでした。次にモデルが少し良くなり、より複雑なフロー（LangGraph）が作れるようになりました。そして大幅に良くなり、新しいタイプのスキャフォールディング—エージェントハーネス—が生まれました。エージェントハーネスの例としては、Claude Code、Deep Agents、Pi（OpenClawを駆動）、OpenCode、Codex、Letta Codeなどがあります。 💡エージェントハーネスはなくなりません。モデルがどんどんスキャフォールディングを吸収するという意見があることがあります。これは正しくありません。実際に起きたこと（そしてこれからも起きること）は、2023年に必要だったスキャフォールディングの多くがもはや必要でなくなったということです。しかしこれは他のタイプのスキャフォールディングに取って代わられました。エージェントは定義上、ツールや他のデータソースと相互作用するLLMです。そのタイプの相互作用を促進するためのシステムが常にLLMの周りに存在します。証拠が必要ですか？Claude Codeのソースコードがリークされたとき、51万2,000行のコードがありました。そのコードがハーネスです。世界最高のモデルのメーカーでさえ、ハーネスに多大な投資をしています。 OpenAIとAnthropicのAPIにウェブ検索などが組み込まれている場合—それらは「モデルの一部」ではありません。むしろ、APIの後ろにある軽量なハーネスの一部であり、ツール呼び出しを通じてモデルとそれらのウェブ検索APIをオーケストレートします。 ## ハーネスはメモリと結びついている Sarah Woodersは「メモリはプラグインではない（ハーネスだ）」という素晴らしいブログを書いており、私も完全に同意します。メモリが特定のハーネスとは別の独立したサービスであるという意見があることがあります。現時点では、これは正しくありません。ハーネスの大きな責任はコンテキストと相互作用することです。Sarahが言うように：「メモリをエージェントハーネスにプラグインしてほしいと頼むのは、車に運転をプラグインしてほしいと頼むようなものです。コンテキストを管理すること、したがってメモリを管理することは、エージェントハーネスのコア能力と責任です。」メモリはコンテキストの一形態に過ぎません。短期メモリ（会話のメッセージ、大きなツール呼び出しの結果）はハーネスによって処理されます。長期メモリ（セッションをまたいだメモリ）はハーネスによって更新・読み込まれる必要があります。Sarahはハーネスがメモリに結びついている他の多くの方法を列挙しています： - AGENTS.mdまたはCLAUDE.mdファイルはどのようにコンテキストに読み込まれますか？ - スキルのメタデータはどのようにエージェントに示されますか？（システムプロンプト？システムメッセージ？） - エージェントは自分自身のシステム指示を変更できますか？ - コンパクション後に何が残り、何が失われますか？ - インタラクションは保存されて照会可能になりますか？ - メモリのメタデータはエージェントにどのように提示されますか？ - 現在の作業ディレクトリはどのように表現されますか？どのくらいのファイルシステム情報が公開されますか？現在、メモリというコンセプトはその初期段階にあります。メモリにとってはまだ非常に早い段階です。透明に言えば、長期メモリはしばしばMVPの一部でないことがわかります。最初にエージェントを一般的に機能させる必要があり、それからパーソナライゼーションを心配できます。これは、業界として私たちがまだメモリを理解しようとしているということを意味します。よく知られた共通のメモリ抽象化は存在しません。メモリがより知られるようになり、ベストプラクティスを発見するにつれて、別個のメモリシステムが意味をなし始めることは可能です。しかし現時点ではまだそこまで来ていません。現時点では、Sarahが言ったように、「最終的に、ハーネスが一般的にコンテキストと状態を管理する方法がエージェントメモリの基盤です。」 ## ハーネスを所有していなければ、メモリを所有していないハーネスはメモリと密接に結びついています。 💡クローズドなハーネスを使っている場合、特にAPIの後ろにある場合、あなたはメモリを所有していません。これはいくつかの方法で現れます。 **軽度に悪い：** ステートフルなAPI（OpenAIのResponses APIやAnthropicのサーバーサイドコンパクションなど）を使っている場合、状態を彼らのサーバーに保存しています。モデルを切り替えて以前のスレッドを再開したい場合—それはもはや可能ではありません。 **悪い：** クローズドなハーネス（Claude Agent SDKのような、オープンソースでないClaude Codeをフードの下で使用）を使っている場合、このハーネスはあなたには不明な方法でメモリと相互作用します。おそらくクライアントサイドにいくつかのアーティファクトを作成します—しかし、それらの形状は何で、ハーネスはそれらをどう使うべきですか？それは不明であり、したがって1つのハーネスから別のハーネスに転送不可能です。 💡しかし最悪なのは別のことです—長期メモリを含むハーネス全体がAPIの後ろにある場合です。この状況では、長期メモリを含めて、メモリへの所有権や可視性はゼロです。ハーネスを知らない（つまりメモリの使い方を知らない）。しかしさらに悪いことに—メモリさえ所有していません！一部がAPIで公開されているかもしれません、まったく公開されていないかもしれません—それに対してコントロールはありません。「モデルがどんどんハーネスを吸収する」と言うとき—これが本当に意味することです。これらのメモリ関連の部分がモデルプロバイダーが提供するAPIの後ろに入るということです。 💡これは非常に警戒すべきことです—メモリが単一のプラットフォーム、単一のモデルにロックインされることを意味します。モデルプロバイダーはこれをするための強いインセンティブを持っています。そして彼らは始めています。AnthropicはClaude Managed Agentsを立ち上げました。これはすべてをAPIの後ろに置き、彼らのプラットフォームにロックインします。ハーネス全体がAPIの後ろになくても、モデルプロバイダーはどんどん多くをAPIの後ろに移動させるインセンティブを持っており、すでにそうしています。例えば：CodexはオープンソースですがOpenAIのエコシステム外では使用できない暗号化されたコンパクションサマリーを生成します。なぜそうするのですか？メモリは重要であり、モデルだけからは得られないロックインを生み出すからです。 ## メモリは重要であり、ロックインを生み出すメモリはまだ初期段階ですが、それが重要であることは誰もが明らかに理解しています。ユーザーが相互作用するにつれてエージェントが良くなることを可能にし、データフライホイールを構築できるようにします。エージェントを各ユーザーにパーソナライズし、彼らの欲求と使用パターンに合わせて成形するエージェント体験を構築することを可能にします。 💡メモリがなければ、あなたのエージェントは同じツールへのアクセスを持つ誰でも簡単に複製できます。メモリがあれば、プロプライエタリなデータセット—ユーザーの相互作用と好みのデータセット—を構築します。このプロプライエタリなデータセットにより、差別化された、ますます知的な体験を提供できます。これまではモデルプロバイダーを切り替えることが比較的簡単でした。同一ではないとしても、類似したAPIを持っています。確かに、プロンプトを少し変える必要がありますが、それほど難しくはありません。しかしこれはすべてステートレスだからです。状態が関連付けられた瞬間、切り替えはずっと難しくなります。このメモリが重要だからです。切り替えると、それへのアクセスを失います。一つのストーリーをお話しします。私は内部でメールアシスタントを持っています。Fleetで構築したテンプレートの上に作られています—Fleetはエンタープライズ対応のOpenClawを構築するためのノーコードプラットフォームです。このプラットフォームにはメモリが組み込まれているので、過去数ヶ月間メールアシスタントと相互作用するにつれてメモリが構築されました。数週間前、エージェントが誤って削除されました。私はとても腹が立ちました！同じテンプレートからエージェントを作成しようとしましたが、体験がずっと悪くなりました。私のすべての好み、トーン、すべてを再び教える必要がありました。メールエージェントが削除された良い面—メモリがいかに強力で粘着性があるかを気づかせてくれました。 ## オープンメモリ、オープンハーネスメモリはオープンにされる必要があり、エージェント体験を開発している人が所有する必要があります。実際にコントロールするプロプライエタリなデータセットを構築できるようにします。メモリ（したがってハーネス）はモデルプロバイダーとは別であるべきです。自分のユースケースに最適なモデルを試す選択肢を持ちたいはずです。モデルプロバイダーはメモリを通じてロックインを作り出すインセンティブを持っています。これが私たちがDeep Agentsを構築している理由です。Deep Agentsは： - オープンソース - モデル非依存 - agents.mdやスキルのようなオープンスタンダードを使用 - メモリ保存のためのMongo、Postgres、Redis、その他へのプラグイン - デプロイ可能：(1) LangSmith Deployment経由（セルフホスト可能、任意のクラウドにデプロイ可能、メモリストアとして機能する独自のデータベースを持ち込める）；(2) 任意の標準ウェブホスティングフレームワークの後ろメモリを所有するためには、オープンハーネスを使用する必要があります。今日Deep Agentsを試してみてください。レビューと考えをいただいた皆さんに感謝： - Sydney Runkle、Deep Agentsとメモリの素晴らしい作業をしています - Viv Trivedy、エージェントハーネスの第一人者 - Nuno Campos、ファイナンスエージェントのコンテキストエンジニアリングについての素晴らしい記事があります - Sarah Wooders、ステートフルエージェントの最前線に一貫していたLettaのCTO

あなたのハーネス、あなたのメモリ — エージェントハーネスとメモリの密接な関係

AIFCC — AI Fluent CxO Club