AIエージェントに必要な5層システム設計

1940年代初頭、ベル研究所は当時世界で最も複雑な技術システムである全国電話ネットワークを構築していました。何百万ものスイッチ、ケーブル、リレー、オペレーターが協調して動作する必要がありました。エンジニアたちは80年間の教訓となる何かを発見しました：個々のコンポーネントを最適化してもシステム全体を最適化することはできない。全体の動作（通話ルーティング、信頼性、容量、コスト）は部品の相互作用から生まれました。彼らはコンポーネント間の相互作用に焦点を当てた規律を必要としていました。彼らはそれをシステムズエンジニアリングと呼びました。エージェント型ソフトウェアのエコシステムは、この規律を生み出した同じ過ちを繰り返しています。現在のハーネスエンジニアリングの流れは、ストレージとメモリにファイルシステムを使うよう求め、次にその制限を回避しようとしてデータベース上に仮想化ファイルシステムを構築します。バッシュを汎用ツールとして使うよう求め、次にセキュリティを処理するためにリクエストごとのサンドボックスを強制します。これらはシステム全体を考慮せずに一部を最適化している症状です。そして私たちは、これが正しいアプローチかどうかを一瞬考えることなく、それを受け入れています。 ## ソフトウェアエンジニアリングはシステムズエンジニアリングコーディングエージェントはコードを書くハードルを下げましたが、本番ソフトウェアの要件は下げていません。ソフトウェアエンジニアリングは、常にシステムズエンジニアリングであり、エージェント型ソフトウェアを構築するなら、システムはこの5つの層を橋渡しする必要があります： **1. エージェントエンジニアリング：** エージェントまたはマルチエージェントのロジックと実行フロー。モデル、システム指示、ツール設定、ハンドオフ、コンテキスト管理、可観測性。ここでエージェントが何をするか、どのように動作するか、どのように応答するかを定義します。エージェントの動作は可能な限り決定論的で、そうでない場合は観測可能であるべきです。 **2. データエンジニアリング：** エージェントはアクセスできるコンテキストの質に依存し、コンテキストは本質的にデータに過ぎません。メモリ、ストレージ、知識：すべてデータエンジニアリングの原則で管理されるべきです。これは、適切に設計されたスキーマ、構造化クエリ、高速読み書きのためのデータベース、長期ストレージのためのオブジェクトストレージ、そして知識とメモリを最新に保つパイプラインを意味します。パターンは数十年前からあります。それを活用してください。 **3. セキュリティエンジニアリング：** 認証、RBAC、ガバナンス、データ分離、監査証跡。エージェントの機能はツールで定義され、それらのツールはJWT認証のパーミッションでスコープされるべきです。読み取り専用アクセスはプロンプト命令ではなく、ツール設定です。アクションには承認ティアが必要です：読み取りは自由に実行、書き込みはユーザー承認が必要、機密操作は管理者の承認が必要です。ほとんどのアクションはログに記録され、製品のライフタイム全体でクエリ可能であるべきです。そして、リクエストを分離してください。一人のユーザーのコンテキストが別のユーザーにブリードすることは、バグではなくデータ漏洩です。深刻な結果をもたらし、ユーザーデータを保護する法律があります。したがって、共有サンドボックス上のファイルシステムバックドメモリは良いアイデアではないかもしれません。 **4. インターフェースエンジニアリング：** ユーザーや他のエージェントがエージェントにアクセスする方法。 REST API、Slack、MCPサーバー、ターミナル。以前は1つのAPIと1つのクライアントがありました。今では複数のサーフェスがあり、それぞれに独自のアイデンティティシステムがあります。SlackのユーザーIDは製品のユーザーIDではありません。別のエージェントとして認証するMCPクライアントは人間ユーザーではありません。インターフェースエンジニアリングは、認証、ポリシー、アクセス制御がエージェントが到達可能なすべてのサーフェスで一貫して保たれることを確認することです。 **5. インフラエンジニアリング：** ソフトウェアの実行とスケーリング方法。コンテナ、クラウドデプロイ、水平スケーリング。一般的にDevOpsと呼ばれます。良いニュース：95%は他のサービスを実行するのと同じです。既存のパターンを再利用すれば、うまくいきます。5%の違い：エージェントのリクエストには時間がかかる（ロードバランサーのタイムアウトを増やす）、応答はストリームされる（SSEまたはWebSocketを計画する）、最良のエージェントはプロアクティブ（スケジュールタスク、バックグラウンド実行）。これらは何も新しくありません。 AIエンジニアにとっての重要な気づきは、エージェント型ソフトウェアはただの通常のソフトウェアであり、ビジネスロジックがエージェントに置き換えられ、インターフェースがリクエスト/レスポンスから複数のサーフェスをまたぐストリーミングに変わるということです。システムズエンジニアリングはこれらの部品を協調させる規律であり、機能するエージェント型ソフトウェアを構築するための鍵です。ソフトウェアをシステムの視点から見ると、正しい決断が明らかになります——MCP vs CLIの議論をやめ、エージェントに適切にスコープされたツールを与え、ファイルではなくデータベースにセッション・メモリ・知識を保存します。一つの層を独立して設計すると、残りのシステムに連鎖する制約を引き継ぎ、その制約にパッチを当てるために時間とリソースを無駄にします。システムの視点から設計すると、各層が他の層を強化します。 ## システムズエンジニアリングの実践これほど大きな主張をして、実際のコードを示さないわけにはいきません。 Dashはオープンソースの自己学習型データエージェントです。平易な英語で質問を投げると、SQLを書き、実行し、数字が意味することを教えてくれます。クローンして適応できるほどシンプルで、5つの層すべてを実証できるほど本格的です。 Dashの各層の仕組みは以下のとおりです： **エージェントエンジニアリング** Dashはエージェントのチームです。リーダーが2人のスペシャリストにリクエストをルーティングします：データをクエリするアナリスト（読み取り専用）とビューやサマリーテーブルなどの計算アセットを構築するエンジニア。各スペシャリストは異なる機能に接続された同じツールタイプを取得します。アナリストのSQLツールは読み取り専用データベースエンジンに接続されます。エンジニアのSQLツールは単一のスキーマにスコープされた書き込み可能なエンジンに接続されます。同じインターフェース、異なるパーミッション、プロンプトではなく設定によって決定されます。指示はテーブルメタデータとビジネスルールから実行時にアセンブルされます。 **データエンジニアリング** コンテキストの6つの層とラーニングのためのツール。 SQLを書く生のLLMはすぐに壁に当たります：スキーマに意味がなく、型が誤解を招き、部族知識が欠如し、ミスから学ぶ方法がありません。Dashはこれを6つのグラウンデッドコンテキストの層で解決します：テーブルメタデータ（スキーマ、カラム、リレーションシップ）人間のアノテーション（メトリクス、定義、ビジネスルール）クエリパターン（動作することが既知のSQL）機関知識（ドキュメント、Wiki）ラーニング（エラーパターンと発見された修正）ランタイムコンテキスト（ライブスキーマインスペクション）。これらの層は2つのシステムに供給されます：最初はキュレーションされた知識：PostgreSQLに読み込まれたテーブルスキーマ、検証されたクエリ、ビジネスルール。 2番目は発見されたラーニング：エージェントが問題に当たったときに保存し、将来のクエリで想起するエラーパターンと修正。ラーニングループはシンプルです：エージェントがクエリを実行し、型エラーを得て、修正を診断し、保存します。次に同様のカラムを見たとき、最初から正しく処理します。そしてエンジニアが新しいビューを作成すると、スキーマとサンプルクエリをナレッジベースに記録します。アナリストは次の検索でそれを発見し、使い始めます。クエリ100はクエリ1より優れています——モデルが改善されたからではなく、データ層が改善されたからです。 **セキュリティエンジニアリング** システムによって強制され、プロンプトではない。本番のDashはJWT検証を使用したRBACを使用します。すべてのクエリは`user_id`にスコープされます。評価スイートはこれらの境界を直接テストします：エージェントに資格情報の漏洩、破壊的なSQLの実行、スキーマ境界の越境を促し、それができないことを検証します。セキュリティは層をまたいでテストされたシステムプロパティです。アナリストの読み取り専用アクセスはPostgreSQLの接続パラメーターです。データベース自体は、モデルが何を生成するかに関わらず書き込みを拒否します。エンジニアは書き込みができますが、単一のスキーマのみ：クエリレベルのガードがソースデータを対象とする操作をブロックします。 **インターフェースエンジニアリング** DashはREST API、Slack bot、Web UI、CLIとして利用可能です。各サーフェスはアイデンティティを異なる方法で処理します：Slackはスレッドタイムスタンプをセッションにマッピングし、APIは本番でJWTトークンを使用します。しかし4つすべてが同じエージェント、同じツール、同じ知識に到達します。エージェントはどのサーフェスから呼ばれているか知らないため、認証とアクセス制御はすべてのサーフェスで保たれる必要があります。 **インフラエンジニアリング** 最小限のPythonコンテナ。ローカル開発のためのDocker Compose。任意のクラウドにデプロイ。標準のASGIサーバーを通じてSSEによるストリーミング。他のサービスと同一の95%は同一です。5%の違い（長いタイムアウト、ストリーミング、スケジュールタスク）は標準ツールで処理されます。クローンして`docker compose up`を実行するだけで、システム全体が立ち上がります。ワンコマンド、5つの層、システムズエンジニアリングのおかげで機能する製品です。参考リンク：https://github.com/agno-agi/dash

AIエージェントに必要な5層システム設計

AIFCC — AI Fluent CxO Club