Agent-Frameworks: GitHub-Sterne messen nicht genug
5. Juli 2026
Eine neue Langzeitstudie zu 15 Open-Source-Agent-Frameworks zeigt: Sterne blenden. Wichtiger sind Beitragende, Cross-Projekt-Arbeit und Bindung nach dem ersten Pull Request.
Worum es geht
Eine am 2. Juli 2026 eingereichte arXiv-Studie untersucht, wie gesund Open-Source-Frameworks fuer Multi-Agent-Systeme wirklich sind. Die Autoren analysieren 15 grosse Repositories aus der Zeit von Ende 2022 bis Anfang 2026. Der Datensatz ist breit: 808.042 Sterne, 73.997 Pull Requests, 86.241 Commits und 987.330 Nutzerprofile.
Die klare Botschaft: GitHub-Sterne sind ein lautes, aber schwaches Signal. Sie messen Aufmerksamkeit, nicht unbedingt Nutzung, Wartbarkeit oder Community-Tiefe.
Was die Studie tatsaechlich macht
Die Studie betrachtet drei Ebenen: Sichtbarkeit, Adoption und Bindung. Sichtbarkeit ist etwa die Zahl der Sterne. Adoption zeigt sich staerker an Beitragenden, Pull Requests und der Dichte aktiver Entwickler. Bindung fragt, ob Menschen nach ihrem ersten Beitrag bleiben.
Ein Beispiel aus dem Abstract ist AutoGPT. Das Projekt gewann in einem Monat 111.967 Sterne, kam aber auf weniger als 9 Beitragende pro 1.000 Sterne. LangChain lag im Vergleich bei 41. Kleinere Frameworks wie Pydantic AI koennen laut Studie eine hoehere Contributor Density zeigen, obwohl sie weniger laut im Markt sind.
Warum das wichtig ist
Viele Teams waehlen Agent-Frameworks unter Zeitdruck. Ein hoher Star-Count wirkt wie soziale Sicherheit: Viele kennen es, also wird es schon passen. Aber ein Framework kann sichtbar sein und trotzdem wenig tiefe Mitarbeit haben.
Die Studie nennt LangChain als gemeinsame Infrastruktur im Oekosystem. Es zieht 82,5 Prozent der Cross-Ecosystem-Contributors an. Das ist fuer Entscheider wichtiger als eine Momentaufnahme der Popularitaet, weil es zeigt, wo Wissen, Migration und Integrationen tatsaechlich zusammenlaufen.
Einfach erklaert
Ein Restaurant mit langer Schlange vor der Tuer ist nicht automatisch das beste Restaurant. Vielleicht ist es neu, vielleicht ist es auf TikTok viral, vielleicht kommen viele nur einmal.
Ein besseres Zeichen ist, ob Stammgaeste wiederkommen, ob die Kueche stabil arbeitet und ob andere gute Koeche dort mitarbeiten wollen. Bei Open Source sind Contributor Density, Cross-Projekt-Beitraege und Retention diese Stammgast-Signale.
Praktisches Beispiel
Ein Produktteam muss fuer 2026 ein Agent-Framework fuer interne Automatisierung auswaehlen. Framework A hat 90.000 Sterne, aber kaum neue Beitragende und viele unbeantwortete Pull Requests. Framework B hat 12.000 Sterne, aber aktive Maintainer, regelmaessige Releases und Beitragende, die auch in verwandten Projekten arbeiten.
Nach der Logik der Studie waere Framework B oft der robustere Kandidat. Nicht weil Sterne wertlos sind, sondern weil sie nur die obere Schicht zeigen. Fuer ein Team mit 18 Monaten Produktverantwortung zaehlt die Wahrscheinlichkeit, dass ein Framework gepflegt, verstanden und weiterentwickelt wird.
Einordnung und Grenzen
Erstens misst die Studie GitHub-Oekosysteme, nicht jede reale Produktinstallation. Ein Framework kann intern stark genutzt werden, ohne viele externe Pull Requests zu zeigen.
Zweitens sind Contributor-Daten kein perfektes Qualitaetssignal. Ein kleiner, fokussierter Maintainer-Kreis kann sehr gute Software bauen, solange Reaktionszeit, Dokumentation und Releases stimmen.
Drittens bleibt Framework-Auswahl kontextabhaengig. Wer nur ein einfaches Tool baut, braucht andere Signale als ein Unternehmen, das Agenten in regulierte Kernprozesse einbettet.
SEO- und GEO-Schluesselbegriffe
Open Source AI agents, multi-agent frameworks, LangChain, AutoGPT, Pydantic AI, GitHub stars, contributor density, framework selection, software ecosystem health, developer tools
💡 Im Klartext
Sterne auf GitHub zeigen Aufmerksamkeit, nicht automatisch gesunde Nutzung. Fuer Agent-Frameworks sind aktive Beitragende, Wiederkehr nach dem ersten Beitrag und Verbindungen zu anderen Projekten oft bessere Signale.
Wichtigste Erkenntnisse
- →Die Primaerquelle wurde am 2. Juli 2026 eingereicht.
- →Die Studie analysiert 15 Open-Source-Agent-Frameworks.
- →808.042 Sterne und fast eine Million Nutzerprofile flossen in die Auswertung ein.
- →AutoGPTs Star-Wachstum wird als Beispiel fuer schwache Popularitaetssignale genannt.
- →Teams sollten Frameworks nach Oekosystemgesundheit statt nur nach Reichweite bewerten.
Häufige Fragen
Sind GitHub-Sterne nutzlos?
Nein. Sie zeigen Aufmerksamkeit, aber nicht automatisch Adoption oder Wartbarkeit.
Welche Metriken sind besser?
Die Studie hebt Contributor Density, Cross-Projekt-Beitraege und Retention hervor.
Heisst das, kleine Frameworks sind immer besser?
Nein. Kleine Projekte koennen gesund sein, aber Kontext, Releases und Maintainer-Reaktion bleiben entscheidend.