Speicher für
Das native Speichersystem für Hermes Agent. SQLite-basiert, submillisekunde, null Abhängigkeiten. Keine Cloud. Keine API-Schlüssel. Nur pure Geschwindigkeit.
Migrieren Sie von Zep, Mem0, Honcho oder Hindsight mit einem Befehl — siehe Migrationsdokumentation
Drei Zeilen. Unendlicher Speicher.
Keine Konfigurationsdateien. Keine Umgebungsvariablen. Keine Cloud-Konten. Importieren, erinnern, abrufen. Das ist alles.
- pip install mnemosyne-memory
- Keine externen Dienste erforderlich
- Funktioniert immer offline
- Hermes Agent Integration integriert
from mnemosyne import remember, recall
# Store a memory
remember(
"User prefers dark mode",
importance=0.9,
scope="global"
)
# Retrieve relevant context
results = recall("user preferences")
# => [{"content": "User prefers dark mode", ...}]Alles was Sie brauchen. Nichts was Sie nicht brauchen.
Von Grund auf für KI-Agenten entwickelt, die schnelle, zuverlässige und beständige Speicherung benötigen.
Submillisekunden-Latenz
Direkter SQLite-Zugriff liefert <1ms Abfragen. Kein Netzwerk-Overhead. Keine HTTP-Roundtrips.
100% Privat
Alle Daten bleiben auf Ihrem Rechner. Keine Cloud-Dienste. Keine Daten verlassen Ihr Gerät, jemals.
Native Vektorsuche
sqlite-vec-Integration für semantische Suche. Hybrides Ranking: 50% Vektor + 30% FTS + 20% Wichtigkeit.
Beam-Architektur
Dreistufiger Speicher: working_memory für aktiven Kontext, episodic_memory für Langzeit, scratchpad für Reasoning.
Automatische Konsolidierung
Alte Arbeitsspeicher werden automatisch zusammengefasst und via Schlafzyklen in den episodischen Speicher verschoben. Konfigurierbare auto_sleep-Intervalle.
Hybride Suche
Kombiniert Vektorähnlichkeit, Volltextsuche und Wichtigkeitsscore für die beste Abrufgenauigkeit.
Streaming & DeltaSync
Echtzeit-inkrementelle Speicher-Updates via DeltaSync. Streamen Sie Ergebnisse, sobald sie eintreffen.
Intelligentes Filtern
ignore_patterns blockiert laute oder irrelevante Inhalte. Halten Sie Ihr Kontextfenster sauber und fokussiert.
Zahlen, die sprechen
Gemessen auf CPU mit sqlite-vec + FTS5. Keine GPU erforderlich.
| Operation | Honcho | Zep | Mem0 | Mnemosyne |
|---|---|---|---|---|
| Schreiben | 45ms | 85ms | 50ms | 0.81ms |
| Lesen | 38ms | 62ms | 45ms | 0.076ms |
| Suche | 52ms | 78ms | 60ms | 1.2ms |
| Kaltstart | 500ms | 800ms | 300ms | 0ms |
BEAM Benchmark (ICLR 2026)
End-to-End-Speicherabruf in großem Maßstab. LLM-als-Richter gegen veröffentlichte Basiswerte.
Mnemosyne vs. Cloud-Speicheranbieter
Sehen Sie genau, was Sie gewinnen — und was Sie aufgeben — beim Wechsel.
| Funktion | Mnemosyne | Honcho | Zep | Mem0 |
|---|---|---|---|---|
| Kosten | Für immer kostenlos | $$$ Bezahlt (Credits) | $$$ Bezahlt (Flex+) | Freemium (0–249 $/Monat) |
| Hosting | Lokal – Ihr Rechner | Nur Cloud | Cloud / BYOC | Nur Cloud |
| Datenschutz | 100% lokal, keine Datenexfiltration | Externe API-Aufrufe | Externe API-Aufrufe | Externe API-Aufrufe |
| Offline-Modus | Ja – Flugmodus | Nein | Nein | Nein |
| Einrichtung | pip install | Docker + API-Schlüssel | Docker + Postgres | API-Schlüssel + Registrierung |
| Vektorspeicher | sqlite-vec (integriert) | pgvector (extern) | pgvector (extern) | pgvector (extern) |
| Volltextsuche | FTS5 (integriert) | Separater Dienst | Separater Dienst | Separater Dienst |
| Authentifizierung erforderlich | Keine | Supabase auth | OAuth / API-Schlüssel | API-Schlüssel |
| Ratenbegrenzung | Unbegrenzt | Planabhängig | Kreditbasiert | Planabhängig |
| Dateneigentum | Sie besitzen die SQLite-Datei | Vom Anbieter gehostet | Vom Anbieter gehostet | Vom Anbieter gehostet |
| Export / Import | Eine JSON-Datei | Eingeschränkt | Eingeschränkt | Eingeschränkt |
| Abhängigkeiten | Python stdlib + ONNX | Docker, Postgres | Docker, Postgres | pip + API-Schlüssel |
| Speicherarchitektur | BEAM (3-stufig) | Sitzung + Fakten | Graph RAG + Fakten | Sitzung + Fakten |
| Automatische Konsolidierung | Schlafzyklen integriert | Manuell / bezahlt | Manuell | Manuell |
| Temporale Tripel | Nativ mit Gültigkeit | Nein | Nein | Nein |
| LongMemEval | 98.9% Recall@All@5 | Nicht veröffentlicht | Nicht veröffentlicht | Nicht veröffentlicht |
| BEAM-100K | 35.4% / 19.3% / 19.2% | Nicht veröffentlicht | Nicht veröffentlicht | Nicht veröffentlicht |
Wechsel von Honcho
500x schnelleres Lesen, keine monatliche Rechnung, 100% offline, kein Docker, kein Kreditsystem
Cloud-Dashboard, verwaltete Skalierung, Team-Freigabe
Wechsel von Zep
43x schnellere Suche, kein PostgreSQL zu warten, kein Bereitstellungsaufwand, sofortiger Kaltstart
Graph RAG-Visualisierung, SOC-2-Zertifikate, verwaltetes BYOC
Wechsel von Mem0
Submillisekunden bei allem, keine Ratenbegrenzung, keine Anbieterbindung, vollständige Datenportabilität
Verwaltete Plattform, 90K+ Community, YC-Ökosystem
Wechsel von Hindsight
Null Abhängigkeiten, keine Netzwerkaufrufe, SQLite-nativ, BEAM-Architektur
Cloud-Sync, verwaltete Inferenz, Web-Dashboard
Fazit
- ✓Geschwindigkeit: 43-500x schneller als Cloud-Alternativen — keine HTTP-Roundtrips.
- ✓Datenschutz: Daten verlassen nie Ihren Rechner. Keine API-Aufrufe. Keine Telemetrie.
- ✓Kosten: Null laufende Kosten. Keine Credits. Keine Stufen. Kein "Verkauf kontaktieren."
- ✓Einfachheit: Ein pip install. Kein Docker. Keine Konfiguration. Keine Anmeldung.
Kompromiss: Sie verwalten Ihr eigenes Backup (eine SQLite-Datei). Kein Web-Dashboard oder Team-Zusammenarbeit — Mnemosyne ist für einzelne Entwickler und lokale Agenten gebaut.
Zweistufiger episodisch-assoziativer Speicher (Beam)
Drei SQLite-Tabellen in Harmonie. Arbeitsgedächtnis für aktiven Kontext, automatisch in Prompts injiziert. Episodisches Gedächtnis für Langzeitspeicherung. Scratchpad für temporäres Reasoning.
Arbeitsgedächtnis
Heißer, aktueller Kontext — automatisch in Prompts injiziert. Standardmäßig sitzungsbezogen, globaler Gültigkeitsbereich verfügbar.
Episodisches Gedächtnis
Langzeitspeicherung mit sqlite-vec + FTS5. Hybrides Ranking für semantische + Textsuche.
Scratchpad
Temporärer Arbeitsbereich für Agenten-Reasoning. Wird pro Sitzung gelöscht.
# Working memory — auto-injected
beam.remember("User prefers dark mode")
# Episodic — long-term with embedding
beam.remember(
content="Detailed project context...",
source="conversation",
importance=0.8
)
# Hybrid recall across both tiers
results = beam.recall("user preferences")
# Consolidation — move old to episodic
beam.sleep() # Compress & summarizeEin Befehl. Null Konfiguration.
Starten Sie in Sekunden. Keine Einrichtung erforderlich.
# Basic install pip install mnemosyne-memory # With all features (dense retrieval + local LLM) pip install mnemosyne-memory[all] # As Hermes MemoryProvider python -m mnemosyne.install
Für die Produktion gebaut
“Ich benutze es heute (habe mem0 ersetzt) und bin bisher wirklich beeindruckt. Gut gemacht!”
“Mnemosyne hat unsere gesamte Speicherinfrastruktur ersetzt. Von 50ms durchschnittlicher Latenz auf unter eine Millisekunde. Unglaublich.”
“Die Beam-Architektur ergibt einfach Sinn. Arbeitsgedächtnis für Kontext, episodisch für Langzeit, automatische Konsolidierung.”
Geben Sie Ihrem Agenten ein Gedächtnis
Schließen Sie sich der wachsenden Zahl von Entwicklern an, die Cloud-Speicherdienste durch etwas Schnelleres, Einfacheres und völlig Privates ersetzt haben.
