AIFCC
記事一覧へ
claude-setupharness-designai-thinking

Gemma 4:Googleの史上最高オープンモデル

Ben Sigman@bensig
7,855792
友人のミラ・ジョヴォヴィッチと私は、Claudeを使ったAIメモリシステムを数ヶ月かけて開発しました。標準ベンチマークで満点を記録し、無料・有料を問わずこの分野の全製品を上回りました。 「MemPalace」と名付けたこのシステムは、他のどのものとも異なる仕組みで動作します。 クラウド上のバックグラウンドエージェントにデータを送信する代わりに、会話をローカルで解析し、「宮殿」として組織化します。宮殿とは、翼・ホール・部屋といった構造を持つアーキテクチャで、人間の記憶の実際の働き方を模倣しています。 その結果として得られるもの: → 一言も入力する前から、AIがあなた自身を把握(家族・プロジェクト・好みを約120トークンで読み込み) → 宮殿アーキテクチャがドメインと種類別にメモリを整理——単なるフラットなファクトリストではなく、ナビゲート可能な構造 → 数ヶ月分の会話をまたぐセマンティック検索で、1番目か2番目の位置に答えを発見 → AAAK圧縮により、あなたの全ライフコンテキストを120トークンに収録——どのLLMもネイティブに読める30倍の可逆圧縮 → 矛盾検出機能が、誤った名前・代名詞・年齢を表示前にキャッチ ベンチマーク結果: **LongMemEval で100%リコール**——史上初の満点記録。500問/500問正解。全問題タイプで100%。 **ConvoMemで92.9%**——Mem0のスコアの2倍以上。 **LoCoMoで100%**——多段推論の全カテゴリで満点。多くのシステムが苦戦する時間的推論も含む。 APIキー不要。クラウド不要。サブスクリプション不要。依存関係は1つのみ。ローカルマシンで動作。あなたのメモリが外部に出ることはありません。 MITライセンス。100%オープンソース。
原文を表示 / Show original
My friend Milla Jovovich and I spent months creating an AI memory system with Claude. It just posted a perfect score on the standard benchmark - beating every product in the space, free or paid. It's called MemPalace, and it works nothing like anything else out there. Instead of sending your data to a background agent in the cloud, it mines your conversations locally and organizes them into a palace - a structured architecture with wings, halls, and rooms that mirrors how human memory actually works. Here is what that gets you: → Your AI knows who you are before you type a single word - family, projects, preferences, loaded in ~120 tokens → Palace architecture organizes memories by domain and type - not a flat list of facts, a navigable structure → Semantic search across months of conversations finds the answer in position 1 or 2 → AAAK compression fits your entire life context into 120 tokens - 30x lossless compression any LLM reads natively → Contradiction detection catches wrong names, wrong pronouns, wrong ages before you ever see them The benchmarks: 100% recall on LongMemEval — first perfect score ever recorded. 500/500 questions. Every question type at 100%. 92.9% on ConvoMem — more than 2x Mem0's score. 100% on LoCoMo — every multi-hop reasoning category, including temporal inference which stumps most systems. No API key. No cloud. No subscription. One dependency. Runs on your machine. Your memories never leave. MIT License. 100% Open Source.

AIFCC — AI Fluent CxO Club

読み書きそろばん、AI。経営者が AI を自分で動かせるようになるコミュニティ。

Gemma 4:Googleの史上最高オープンモデル | AIFCC