KI-Tools

Graphify: 71.400 Stars in 80 Tagen – Hype oder Gamechanger für AI Coding Assistants?

Graphify baut aus deiner Codebase einen Knowledge Graph für KI-Coding-Assistenten. 71.400 GitHub-Stars in 80 Tagen – was steckt dahinter, und für wen lohnt es sich?

Kurzfassung: Graphify ist ein quelloffener Skill, der aus Code, Docs, PDFs, Bildern und Videos einen abfragbaren Knowledge Graph baut, den KI-Coding-Assistenten wie Claude Code, Codex, Cursor oder Gemini CLI per MCP nutzen. Entwickelt von Safi Shamsi (Y Combinator S26), seit dem Launch am 5. April 2026 viral: rund 71.400 GitHub-Stars in etwa 80 Tagen, über 1,1 Millionen PyPI-Downloads, MIT-Lizenz. Die Kernidee ist eine Drei-Pass-Architektur, von der nur ein Schritt deine Maschine verlässt. Der vielzitierte Anspruch einer bis zu 71-fachen Token-Ersparnis stammt aus einem kleinen Benchmark, ein unabhängiger Test fand nur 7 bis 8 Prozent. Der reale Nutzen skaliert mit Größe und Medienvielfalt deines Projekts: für große, gemischte Repos spannend, für kleine Code-Projekte überflüssig.

Was ist Graphify?

Graphify ist ein Open-Source-Tool, das deine gesamte Codebase samt Begleitmaterial in einen strukturierten Wissensgraphen umwandelt. Statt dass dein KI-Assistent bei jeder Frage Dateien neu einliest, fragt er einen vorab gebauten Graphen ab: Welche Funktion ruft welche auf, welches Dokument beschreibt welches Modul, welcher Commit hängt mit welchem Ticket zusammen. Installiert wird Graphify als Skill, der sich über einen /graphify-Slash-Command oder die Kommandozeile ansprechen lässt. Das Ergebnis liegt anschließend in einem Ordner graphify-out/: eine interaktive graph.html (gerendert mit vis.js), ein GRAPHREPORT.md mit den wichtigsten Knoten und Clustern sowie eine graph.json, die Programme und KI-Agenten direkt abfragen können.

Der übliche Weg, einer KI Kontext über große Codebasen zu geben, ist RAG (Retrieval-Augmented Generation): Texte werden in Vektoren übersetzt und nach Ähnlichkeit gesucht. Graphify geht den anderen Weg und bildet explizite Beziehungen als Kanten zwischen Knoten ab. Das macht Abfragen wie „zeige alle Aufrufpfade zu dieser Funktion" präzise beantwortbar, statt nur semantisch ähnliche Schnipsel zurückzugeben. Wenn dich die grundsätzliche Abwägung interessiert, lohnt der Vergleich im LLM-Wiki-Konzept gegenüber RAG.

Graphify ist nicht an ein Tool gebunden. Über das Model Context Protocol (MCP) stellt es den Graphen als Werkzeug bereit, das laut Projektangaben mit über 20 Plattformen funktioniert, darunter Claude Code, Codex, Cursor, Gemini CLI, OpenCode, Aider und GitHub Copilot. Der KI-Assistent bekommt damit Tools wie querygraph, getnode oder shortestpath an die Hand.

Wie funktioniert die 3-Pass-Architektur?

Das technische Herzstück von Graphify ist eine Pipeline aus drei Verarbeitungsschritten. Der entscheidende Punkt für viele Nutzer: Nur der dritte Schritt verlässt überhaupt deine Maschine.

- Pass 1 (Struktur, lokal): Mit dem Parser tree-sitter wird der Code in einen abstrakten Syntaxbaum (AST) zerlegt. Hier entstehen die harten Fakten des Graphen, etwa welche Funktion welche aufruft. Läuft komplett offline. - Pass 2 (Audio, lokal): Videos und Audiodateien werden mit faster-whisper transkribiert, ebenfalls lokal. Damit fließen auch Onboarding-Videos oder aufgezeichnete Architektur-Diskussionen in den Graphen ein. - Pass 3 (Semantik, über deinen API-Provider): Erst hier kommt ein LLM ins Spiel. Es interpretiert Docs, PDFs und Bilder und leitet Bedeutungen ab. Dieser Schritt nutzt deinen eigenen API-Schlüssel bei Anthropic, OpenAI oder einem anderen Anbieter.

Eine Besonderheit: Jede Kante im Graphen bekommt ein Vertrauens-Label. EXTRACTED markiert harte AST-Fakten, INFERRED eine LLM-Vermutung mit Score zwischen 0,0 und 1,0, und AMBIGUOUS einen unsicheren Fall. So lässt sich theoretisch unterscheiden, was belegt ist und was die KI nur behauptet. Ob Entwickler diese Tags in der Praxis tatsächlich prüfen, ist allerdings offen.

Anders als klassische RAG-Pipelines, die bei jeder Änderung neu embedden, patcht Graphify nur die betroffenen Knoten und Kanten. Ein installierbarer Git-Hook (graphify hook install) hält den Graphen nach Commits aktuell, ein Merge-Driver verhindert Konflikte in der graph.json. Eine Echtzeit-Synchronisation ist das trotzdem nicht.

Wie ist Graphify so schnell viral gegangen?

Die Wachstumskurve ist der eigentliche Aufreger. Graphify startete am 5. April 2026. Den Ausschlag gab laut den vorliegenden Berichten ein Tweet von Andrej Karpathy, woraufhin das Projekt in zwei Tagen die ersten 1.000 Stars sammelte. Nach 26 Tagen standen über 450.000 Downloads und rund 40.000 Stars zu Buche, nach etwa 80 Tagen rund 71.400. Dazu kommen die harten Projektzahlen: 71 Contributors, 123 Releases in rund 80 Tagen, die Aufnahme in den Y-Combinator-Batch S26 und eine Enterprise-Waitlist. Das ist ungewöhnlich viel Bewegung für ein Tool, das zum Launch im Kern ein Einzelentwickler-Projekt war. Details, Installation und Feature-Liste stehen im offiziellen GitHub-Repository und auf der Projektseite graphifylabs.ai.

Die 71-fache Token-Ersparnis: Hype oder Realität?

Das prominenteste Verkaufsargument ist eine bis zu 71-fache Reduktion der Tokens, die ein KI-Assistent für eine Antwort braucht. Diese Zahl solltest du einordnen, bevor du sie weitergibst. Der Benchmark hinter dem Wert basiert auf einem kleinen Testset von 52 Dateien (ein Karpathy-Repo plus fünf Papers und vier Bilder). Genau diese Mischung aus Code und vielen verschiedenen Medien ist der Idealfall für einen Knowledge Graph. Ein unabhängiger Test mit dem browser-use-Projekt über 10 Abfragen kam dagegen nur auf etwa 7 bis 8 Prozent Ersparnis. Der Widerspruch löst sich auf, wenn man den Mechanismus versteht: Der Spareffekt skaliert mit der Größe und der Medienvielfalt deines Projekts. Bei einem reinen Code-Repo mit weniger als 50 Dateien geht die Ersparnis gegen null, bei einem riesigen Korpus aus Code, Dokumentation und Videos kann sie erheblich sein. Faustregel: Die 71x sind kein Durchschnittswert, sondern eine Obergrenze unter Idealbedingungen. Auch der unabhängige Reviewer von Augment Code ordnet die Zahlen entsprechend als kontextabhängig ein.

Graphify im Vergleich zu Alternativen

Graphify ist nicht das einzige Tool, das KI-Assistenten klüger machen will. Die Ansätze unterscheiden sich deutlich. | Kriterium | Graphify | code-review-graph | Caveman Mode | Eigenbau-RAG | |-----------|----------|-------------------|--------------|--------------| | Ansatz | Knowledge Graph (AST + LLM) | Context Mapping | Prompt-Kompression | Vektor-Embeddings | | Lokal | Pass 1+2 lokal, Pass 3 API | Ja | Ja | Meist API | | Plattformen | 20+ | Claude Code | Claude Code | Eigenbau | | Token-Reduktion | 7x bis 71x (korpusabhängig) | Mittel | Hoch | Mittel | | Incremental Updates | Ja | Nein | — | Nein | | MCP-Server | Ja | Nein | Nein | Optional | | Vertrauens-Tags | EXTRACTED/INFERRED/AMBIGUOUS | Nein | Nein | Nein | Graphify spielt seine Stärke vor allem bei gemischten, großen Codebasen aus. Wer primär die reine Token-Last senken will, fährt mit einem Kompressionsansatz oft einfacher: Wie das geht, zeigen der Caveman Mode und Netflix' Headroom-Kompressionsschicht.

Welche Grenzen hat Graphify?

So beeindruckend die Zahlen sind, die nüchterne Einordnung gehört dazu. - Datenschutz in Pass 3: Pass 1 und 2 laufen lokal, aber Docs, PDFs und Bilder gehen in Pass 3 an deinen API-Provider. Was dort mit den Daten passiert, regelt deine API-Vereinbarung, nicht Graphify. - Veralteter Graph: Der Graph muss nach Code-Änderungen aktualisiert werden. Incremental Updates und ein Watch-Mode helfen, aber bei häufig geänderten Codebasen kann der Graph hinter dem Stand zurückbleiben. - Kein Nutzen für kleine Repos: Bei Projekten mit wenigen Dutzend Dateien lohnt der Aufwand aus Installation und Build-Zeit schlicht nicht. - Junges Projekt: 71 Contributors klingen solide, aber das Tool ist erst rund 80 Tage alt. API-Stabilität und langfristige Wartbarkeit sind offene Fragen, und das verwendete Leiden-Clustering für die Community-Erkennung ist bislang nicht breit unabhängig validiert.

Für wen lohnt sich Graphify?

| Profil | Lohnt sich? | |--------|-------------| | Große, gemischte Codebase (Code, Docs, Videos) | Ja, hier liegt der Sweet Spot | | Monorepo-Teams mit vielen Cross-Referenzen | Ja, vor allem für PR-Triage und Impact-Analyse | | Kleines Code-Repo unter ~50 Dateien | Nein, Overhead lohnt nicht | | Strikte Air-Gap-Anforderung an alle Daten | Nur eingeschränkt (Pass 3 beachten) bzw. Enterprise-Waitlist | | Reine Token-Kostensenkung als Ziel | Eher Kompressionstools prüfen |

Wie installierst du Graphify?

Graphify wird als Python-Paket über PyPI installiert und anschließend auf dein Repository angewendet. Da das Projekt mit 123 Releases sehr schnell iteriert, prüfe den exakten Befehl und die Flags immer im aktuellen README. Optional hältst du den Graphen mit graphify hook install über einen Post-Commit-Hook aktuell. Für die Arbeit mit Pull Requests priorisiert graphify prs --triage offene PRs nach ihrem Impact im Graphen, und graphify prs --conflicts zeigt PRs, die im selben Cluster arbeiten und sich ins Gehege kommen könnten.

FAQ: Häufig gestellte Fragen zu Graphify

Ist Graphify kostenlos? Ja. Graphify ist Open Source unter MIT-Lizenz und kostenlos nutzbar. Kosten entstehen nur indirekt über die API-Nutzung in Pass 3 bei deinem eigenen Anbieter. Für große Unternehmen gibt es zusätzlich eine kostenpflichtige Enterprise-Variante mit Waitlist (Million-File-Corpus, SSO, Audit-Logs, Air-Gapped-Deployment). Sendet Graphify meinen Code an Dritte? Der eigentliche Code wird in Pass 1 lokal mit tree-sitter verarbeitet und verlässt deine Maschine nicht. In Pass 3 gehen jedoch Docs, PDFs und Bilder zur semantischen Analyse an deinen API-Provider. Wer das vermeiden muss, sollte die Enterprise-Optionen prüfen. Stimmt die 71-fache Token-Ersparnis? Als Obergrenze unter Idealbedingungen ja, als Durchschnitt nein. Der Wert stammt aus einem Benchmark mit nur 52 sehr medienvielfältigen Dateien. Ein unabhängiger Test fand bei einem reinen Code-Projekt nur 7 bis 8 Prozent. Die Ersparnis skaliert stark mit Größe und Medienmix deines Projekts. Mit welchen KI-Tools funktioniert Graphify? Laut Projektangaben mit über 20 Plattformen, darunter Claude Code, Codex, Cursor, Gemini CLI, OpenCode, Aider und GitHub Copilot. Die Anbindung läuft über das Model Context Protocol (MCP), das den Graphen als abfragbares Werkzeug bereitstellt. Wie unterscheidet sich Graphify von RAG? RAG sucht nach semantischer Ähnlichkeit in Vektoren, Graphify bildet explizite Beziehungen als Graph ab. Dadurch beantwortet Graphify strukturelle Fragen wie Aufrufpfade präziser, während es bei aktuellen Daten auf einen neu gebauten Graphen angewiesen ist statt auf eine laufende Suche. Lohnt sich Graphify für kleine Projekte? Nein. Bei wenigen Dutzend Dateien überwiegt der Overhead aus Installation und Build-Zeit den Nutzen, und die Token-Ersparnis geht gegen null. Graphify spielt seine Stärke erst bei großen, gemischten Codebasen aus.

Fazit

Graphify ist ein lehrbuchreifes Early Signal: viraler Launch, YC-Aufnahme und 71.400 Stars in 80 Tagen, aber bisher kaum deutsche Tech-Coverage. Technisch ist die Drei-Pass-Architektur mit lokalem AST-Parsing und Confidence-Tagging durchdacht, der 71x-Claim aber eher Marketing-Obergrenze als Alltagswert. Wer eine große, gemischte Codebase mit KI-Assistenten bearbeitet, sollte sich Graphify ansehen; bei kleinen Code-Repos lohnt der Aufwand nicht. Verwandte Themen: Wie KI-Token-Last anders gesenkt wird, zeigen der Caveman Mode und die Headroom-Kompressionsschicht von Netflix. Die Grundsatzfrage Graph gegen Vektor-Suche behandelt das LLM-Wiki-Konzept im RAG-Vergleich, und wie Andrej Karpathy lokales Wissen ganz ohne RAG nutzbar macht, liest du im Obsidian-Second-Brain-Guide. Quellen: Recherche auf Basis des GitHub-Repositorys safishamsi/graphify, graphifylabs.ai, einer unabhängigen Benchmark-Analyse (JIN System Architect auf Medium) sowie eines Reviews von Augment Code, Stand 24. Juni 2026.