KI-Tools

codebase-memory-mcp: 99% weniger Tokens für KI-Coding-Agents

codebase-memory-mcp senkt Tokens für KI-Coding-Agents um bis zu 99%. 14.300 GitHub-Stars, 158 Sprachen, C-Binary ohne Docker. Deep-Dive mit Vergleich und Grenzen.

TL;DR: codebase-memory-mcp ist ein quelloffener Code-Intelligence-Server, der deine Codebase einmalig in einen persistenten Knowledge Graph indexiert und KI-Coding-Agenten wie Claude Code, Codex oder Gemini CLI per Model Context Protocol (MCP) abfragbar macht. Statt Dateien bei jeder Frage komplett einzulesen, holt sich der Agent gezielt nur die Knoten, die er braucht. Das Projekt von DeusData ist in C geschrieben, läuft als Single Static Binary ohne Docker oder Node und sammelte seit März 2026 rund 14.300 GitHub-Stars. Der Marketing-Claim lautet 99% weniger Tokens, etwa 3.400 statt 412.000 in einem Beispielfall. Das begleitende arXiv-Paper misst über 31 Repositorys nüchterner: im Schnitt 10× weniger Tokens bei 83% statt 92% Antwortqualität. Für große Codebasen ist das ein echter Kostenhebel, für kleine Projekte Overhead.

Was ist codebase-memory-mcp?

codebase-memory-mcp ist ein Open-Source-Server, der deine gesamte Codebase in einen strukturierten Wissensgraphen umwandelt und diesen einem KI-Coding-Agenten als durchsuchbares Werkzeug bereitstellt. Statt dass dein Assistent bei jeder Frage Dateien neu durchforstet, fragt er einen vorab gebauten Graphen ab: Welche Funktion ruft welche auf, in welcher Datei liegt ein Symbol, welche Route trifft welchen Handler. Die Anbindung läuft über das Model Context Protocol (MCP), den offenen Standard, über den KI-Agenten externe Werkzeuge ansprechen. Wenn du noch nicht mit MCP gearbeitet hast: Das Prinzip zeigt der Guide, wie du einen MCP-Server an Claude Code anbindest. codebase-memory-mcp stellt darüber 14 MCP-Tools bereit, mit denen der Agent den Graphen abfragt, statt Code-Dateien in sein Kontextfenster zu laden.

Der übliche Weg, einer KI Kontext über eine große Codebase zu geben, ist das Einlesen vieler Dateien oder eine Vektor-Suche per RAG (Retrieval-Augmented Generation). codebase-memory-mcp bildet stattdessen explizite Beziehungen als Kanten zwischen Knoten ab. Damit lassen sich strukturelle Fragen wie „wer ruft diese Funktion auf" präzise beantworten, ohne den halben Quelltext durchzureichen. Den gleichen Grundgedanken verfolgt das parallel virale Graphify, das codebase-memory-mcp bei den Stars deutlich übertrifft.

Das stärkste Unterscheidungsmerkmal ist die Implementierung. codebase-memory-mcp ist in C geschrieben (rund 88% des Codes) und wird als statisch gelinktes Binary mit null Laufzeit-Abhängigkeiten ausgeliefert. Kein Docker, kein Node, kein Python-Environment. Das Binary ist nur wenige Megabyte groß und startet als lokaler Prozess. In einer Tool-Landschaft, die sonst auf Node- oder Python-Stacks setzt, ist das ungewöhnlich und der Grund für die hohe Geschwindigkeit. Lizenz ist MIT, die aktuelle Version v0.8.1 erschien am 12. Juni 2026.

Wie funktioniert codebase-memory-mcp?

Das technische Herzstück ist eine Indexing-Pipeline, die Quellcode parst und in eine persistente Graph-Datenbank schreibt. Anschließend beantwortet der Server Anfragen aus diesem Graphen, statt jedes Mal neu über die Dateien zu laufen.

Der Code wird mit dem Parser tree-sitter in einen abstrakten Syntaxbaum (AST) zerlegt. Daraus entstehen die Knoten und Kanten des Graphen: Funktionen, Klassen, Aufrufketten, HTTP-Routen und service-übergreifende Verbindungen. Laut Projektangaben deckt das Tool 158 Sprachen über tree-sitter ab. Für rund ein Dutzend Sprachen wie Python, TypeScript, Go, Java und Rust kommt zusätzlich eine Hybrid-LSP-Typauflösung hinzu, die den Graphen typbewusst macht.

Der fertige Graph liegt lokal als Datenbank vor und muss nicht bei jeder Sitzung neu gebaut werden. Die Performance ist das eigentliche Argument für den C-Ansatz: Den Linux-Kernel mit rund 28 Millionen Codezeilen indexiert das Tool laut Entwickler in etwa drei Minuten (im schnellen Modus gut eine Minute), einzelne Graph-Abfragen liegen im Bereich unter einer Millisekunde.

Über MCP bekommt der Agent gezielte Werkzeuge statt Roh-Dateien. Dazu zählen searchgraph für die strukturierte Suche nach Symbolen, tracepath für die Frage, wer eine Funktion aufruft und was sie selbst aufruft, getarchitecture für einen Überblick aus Sprachen, Paketen und Hotspots, querygraph für Cypher-artige Abfragen sowie detectchanges, das ein Git-Diff auf betroffene Symbole und deren Risiko abbildet.

Warum 99% weniger Tokens das entscheidende Feature ist

Für die Zielgruppe ist die Token-Last das Kernproblem: Bei API-basierten Coding-Agents wie Claude Code, Cursor oder Copilot kostet jeder Token Geld, und große Codebasen sprengen das Kontextfenster. Genau hier setzt codebase-memory-mcp an. Der Marketing-Claim von 99% weniger Tokens (genauer: rund 120× weniger, etwa 3.400 statt 412.000 Tokens) stammt aus einem günstigen Beispielfall. Ein unabhängiger Vergleich auf der 108.000-Zeilen-Codebase von FastAPI bestätigt die Größenordnung: codebase-memory-mcp kam mit rund 3.400 Tokens für fünf Abfragen aus, während ein Komplett-Dump per Repomix rund 800.000 Tokens erzeugte. Diese Spitzenwerte solltest du aber einordnen. Das begleitende arXiv-Paper misst über 31 reale Repositorys nüchterner: im Schnitt 10× weniger Tokens und 2,1× weniger Tool-Calls, allerdings auch nur 83% statt 92% Antwortqualität gegenüber einem Datei-für-Datei-Explorer. Auch 10× sind beachtlich, liegen aber eine Größenordnung unter dem 120×-Versprechen. Faustregel: Der Spareffekt skaliert mit der Größe deines Projekts. Bei einem riesigen Monorepo ist er dramatisch, bei einem kleinen Repo, das ohnehin ins Kontextfenster passt, geht er gegen null. Wer Tokens generell senken will, findet im Ansatz der Headroom-Kompressionsschicht von Netflix eine alternative Strategie.

Wie installierst und nutzt du codebase-memory-mcp?

Die Installation läuft über ein einzeiliges Skript, das das passende Binary lädt. Da das Projekt schnell iteriert, prüfe den exakten Befehl immer im aktuellen README. Danach startest du deinen Coding-Agenten neu und weist ihn an, das Projekt zu indexieren („Index this project"). Das Installationsskript erkennt 11 Coding-Agenten automatisch, darunter Claude Code, Codex CLI, Gemini CLI, Zed, Aider, VS Code und KiloCode. Eine manuelle MCP-Konfiguration pro Tool entfällt damit in den meisten Fällen.

codebase-memory-mcp im Vergleich zu Repomix, Aider und Sverklo

codebase-memory-mcp ist nicht der einzige Weg, einem KI-Agenten Codebase-Kontext zu geben. Die Ansätze unterscheiden sich grundlegend. | Kriterium | codebase-memory-mcp | Repomix | Aider repo-map | Sverklo | |-----------|---------------------|---------|----------------|---------| | Ansatz | Knowledge Graph (SQLite) | Voll-Dump als XML/Markdown | Ephemere Text-Map | Hybrid (BM25 + Embeddings) | | Implementierung | C, Single Binary (~2 MB) | Node.js | Python-Env | Node.js | | MCP-Tools | 14 | keine | keine | 37 | | Server-Prozess | ja | nein | nein | ja | | Git-teilbar | nein (zst-Workaround) | ja (Datei) | nein | nein | | Token-Last (FastAPI-Test) | ~3.400 / 5 Abfragen | ~800.000 | 8.000–15.000 | nicht getestet | | Memory | flach | keins | keins | bi-temporal | | Lizenz | MIT | MIT | Apache 2.0 | MIT | Repomix kippt die ganze Codebase in eine einzige Datei, die du committen und teilen kannst, treibt damit aber die Token-Last hoch. Die repo-map von Aider ist clever, aber nur innerhalb von Aider nutzbar, nicht plattformübergreifend. Sverklo bietet mit bi-temporalem Memory das tiefere Code-Verständnis, ist beim Indexing aber deutlich langsamer. codebase-memory-mcp positioniert sich dazwischen: schnell, plattformagnostisch über MCP, aber mit flachem Memory.

Welche Grenzen hat codebase-memory-mcp?

So stark die Zahlen sind, die nüchterne Einordnung gehört dazu. Das Projekt ist erst wenige Monate alt und das merkt man. - Stilles Index-Versagen: Das gravierendste Problem ist Issue 333: Der Indexer meldet status:"indexed", erzeugt für eine 72.000-Zeilen-Rust-Codebase aber nur rund 500 statt der erwarteten Tausenden Knoten. Der Fehler fällt nicht sofort auf, weil der Status Erfolg signalisiert. Wer auf einen unvollständigen Graphen vertraut, bekommt lückenhafte Antworten. - Stabilität und Crashes: Der C-Code bringt Memory-Safety-Risiken mit, in der Vergangenheit wurden Crashes und Segfaults beim Indexing gemeldet. Auch aktuell zeigt der Issue-Tracker offene Probleme wie hängende Whole-Graph-Abfragen oder ein nach einem Upgrade unbrauchbares Setup. Das Tool funktioniert, ist aber noch nicht ausgereift. - Läuft als Server-Prozess: Es ist kein One-Shot-Werkzeug, sondern ein Daemon, der im Hintergrund läuft und Ressourcen belegt. - Nicht nativ git-teilbar: Der Graph ist eine lokale Datenbank. Teamweit teilen lässt er sich nur über den Umweg, ihn als komprimierte .zst-Datei einzuchecken. - Qualitäts-Drop: Die 10× Token-Ersparnis im Paper kostet 9 Prozentpunkte Antwortqualität (83% statt 92%). Wer maximale Korrektheit braucht, zahlt sie in Tokens. - Single-Maintainer-Risiko: Das Projekt wird im Kern von DeusData (Maintainer Martin Vogel) getragen, der bereits eingeschränkte Verfügbarkeit angekündigt hat. Aus der Community kommt zudem der Einwand, ein eigenes Binary sei übertrieben, eine schlichte Memory-Anweisung in der agents.md tue es oft auch.

FAQ: Häufig gestellte Fragen zu codebase-memory-mcp

Ist codebase-memory-mcp kostenlos? Ja. Das Tool ist Open Source unter MIT-Lizenz und kostenlos. Anders als bei Tools, die in einem Schritt ein externes LLM nutzen, läuft das Indexing komplett lokal, es entstehen also keine zusätzlichen API-Kosten allein durch den Graphen. Was ist ein MCP-Server überhaupt? Das Model Context Protocol (MCP) ist ein offener Standard, über den KI-Agenten externe Werkzeuge und Datenquellen ansprechen. Ein MCP-Server stellt solche Werkzeuge bereit, hier den Knowledge Graph als abfragbares Tool. Wie das in der Praxis eingerichtet wird, zeigt der Guide zum Anbinden eines MCP-Servers an Claude Code. Mit welchen KI-Agenten funktioniert es? Das Installationsskript erkennt 11 Agenten automatisch, darunter Claude Code, Codex CLI, Gemini CLI, Zed, Aider, VS Code und KiloCode. Eine manuelle Konfiguration pro Tool ist dadurch meist nicht nötig. Wie groß ist die Token-Ersparnis wirklich? Als Spitzenwert unter günstigen Bedingungen rund 99% beziehungsweise 120× weniger Tokens. Über 31 reale Repositorys gemessen liegt der Schnitt im arXiv-Paper bei 10× weniger Tokens. Beides ist erheblich, der Alltagswert liegt aber näher an 10× als am 120×-Marketingwert. Wie unterscheidet sich codebase-memory-mcp von Graphify? Beide bauen einen Knowledge Graph für KI-Coding-Agenten und binden ihn per MCP an. codebase-memory-mcp setzt auf ein abhängigkeitsfreies C-Binary und indexiert vollständig lokal, während Graphify als Python-Paket läuft und für die semantische Analyse von Docs und Bildern einen API-Provider einbindet. Graphify hat mehr Stars, codebase-memory-mcp die schlankere Architektur. Wie schnell läuft das Indexing? Sehr schnell. Den Linux-Kernel mit rund 28 Millionen Codezeilen indexiert das Tool laut Entwickler in etwa drei Minuten, einzelne Abfragen liegen unter einer Millisekunde. Für durchschnittliche Repositorys geschieht das Indexing im Bereich von Sekunden. Kann ich den Graphen im Team teilen? Nicht direkt. Der Graph ist eine lokale Datenbank und nicht für das Teilen über Git ausgelegt. Als Workaround lässt er sich komprimiert als .zst-Datei ins Repository einchecken, ein echtes Team-Sharing-Feature ist das aber nicht.

Fazit

codebase-memory-mcp ist ein starkes Early Signal: 14.300 Stars in drei Monaten, ein abhängigkeitsfreies C-Binary und ein nachvollziehbares arXiv-Paper, aber bislang keine deutsche Tech-Coverage. Die Token-Ersparnis ist real, der 99%-Claim aber eher Obergrenze als Alltagswert, und das stille Index-Versagen aus Issue 333 solltest du im Blick behalten. Für Nutzer von Claude Code oder Cursor mit großen Codebasen lohnt der Test, bei kleinen Projekten überwiegt der Overhead. Verwandte Themen: Den gleichen Knowledge-Graph-Ansatz mit anderem Stack verfolgt Graphify, eine alternative Strategie zur Token-Senkung zeigt die Headroom-Kompressionsschicht von Netflix. Einen der unterstützten Agenten stellt der Guide zu KiloCode vor, und wie du generell einen MCP-Server an Claude Code anbindest, liest du im passenden Tutorial. Verifizierte Quellen: - GitHub-Repository: https://github.com/DeusData/codebase-memory-mcp - arXiv-Paper 2603.27277: https://arxiv.org/abs/2603.27277 - Token-Vergleich auf dev.to: https://dev.to/thegdsks/i-tested-4-codebase-to-ai-tools-on-fastapi-108k-lines-here-are-the-token-costs-4bmc - Issue 333 (Silent Index Degradation): https://github.com/DeusData/codebase-memory-mcp/issues/333