ファイルシステムへのコンピュート埋め込み

オンボーディング時に、ほぼすべての顧客がクラウドからのエグレス料金について私に聞いてくる。これは理にかなっている。パブリックサービス（あなたのクラウドアカウントで実行していないもの）は、実際のサービスが同じクラウドリージョンにあっても、通信する際に完全なエグレス料金がかかるからだ。残念だが、最大手の顧客向けにはこれを回避するためのプライベートネットワーキングオプションをサポートしている。数ヶ月前、@nikitabaseとDatabricksの買収について話していたとき、彼の顧客もエグレスについて怒っているはずだとどう対処しているかを尋ねた。彼は「一度も話題に上ったことがない」と言い、それが本当に引っかかった。なぜ最大のサーバーレスデータベースプロバイダーが顧客にエグレスを心配させていないのか？私はそれを歩み去り、データベースがIOPS重視でスループット重視ではないという一種のまぐれとして片付けた。少し後に、@richardartoulとArchilについて話していたとき、彼が（自分から）こう言った。「あなたたちはWarpStreamと同じ問題を抱えているよね？みんなエグレスを心配している。なぜなら顧客はサービスに入れた全バイトを1:1で読まなければならないから。どうやって解決するの？」そう、これを理解してくれる人だ。そして真実は彼の言葉の中にあった。「顧客はサービスに入れた全バイトを1:1で読まなければならない。」その瞬間、私は悟った。データストレージの超シンプルなケースで考えてみよう：いくつかのフィールドで検索する場合。データベースでは「select * from table where X = Y」と書くが、ファイルシステムでは...そう、grepを使う。明らかに、この二つには大きな違いがある。ファイルシステムでgrepを使うと、あなたのマシンは検索しているすべてのファイルをダウンロードし、（メモリ内で）マッチするファイルを探す。（余談：シングルスレッドなので、それもまた素晴らしい）データベースで「select .. where」文を実行すると、クライアントはそれをデータベースに送る。データベースには内部にコンピュートが埋め込まれており、同様のことを行うが、よりスマートだ。関連するインデックスを特定し、クエリの最適バージョンを構築しようとし、そして重要なことに、あなたが要求した特定のデータだけを送り返す。それは速そうに聞こえるだけでなく、あなたが実行しているコンピュートとストレージシステムの間のネットワークトラフィックも大幅に少ない。その結果、ファイルシステムでは100GBのエグレスになるかもしれないものが、データベースでは2KB未満になる可能性がある。データベースはデータを直接転送していないからだ。データとどう対話するかの命令を転送している。この事実の結果が、私たちがサービスのレイテンシを下げることにこれほど力を入れている理由であり、数百マイクロ秒のネットワークラウンドトリップがある場合にのみサービスの使用を推奨する理由だ。しかし、なぜファイルシステムはこのように制限されているのかと聞く価値がある。データを生でそのまま転送するのではなく、命令を送ることができる方法はないのか？実際にあり、私たちがすでにファイルシステムとやり取りするために使っている共通言語がある。それはbashインターフェースを持つLinuxコンピュータだ。クライアントがファイルシステムの状態を取得または操作する完全な命令、つまりbashコマンドを送れる世界を想像できる。そのコマンドをファイルシステム自体の内部で実行し、ユーザーが気にする結果だけを返す。データベースの場合と同様に、この実行をどのように行うかについて多くの選択肢がある。bashを最適化して多数の内部コンピュートに分散させるプランナーを実装することもできるし、ストレージが実際に存在するサーバー上にbashをコロケートしてクエリのレイテンシを削減することもできる。大きな勝利：顧客はエグレス、サービスへのレイテンシ、インスタンスのサイジングを心配する必要がなくなる。これがArchilのサーバーレス実行機能で私たちが実現しようとしている未来だ。私たちは弾力的でパフォーマンスが高く、使いやすいだけでなく、顧客が望む方法で機能する最初のファイルシステムを構築している。コンピュートをシステムのファーストクラスプリミティブとして埋め込むことで。サーバーレス実行は、開発者がステートフルシステムを構築する方法を根本的に簡素化すると期待している。エージェント構築の爆発は、ほとんどの開発者が初めてステートフルシステムについて考えなければならない最初の機会だ。会話履歴、プロンプト、メモリ、コンテキストの管理はすべてステートフルな問題だ。サーバーレス実行はこのスタックの重要な部分になるだろう。サーバーレス実行は今日、すべてのArchilファイルシステムにロールアウトされている。console.archil.comで新しいディスクを作成して始めよう。

ファイルシステムへのコンピュート埋め込み

AIFCC — AI Fluent CxO Club