Ist Nanobrowser kostenlos?

Das Projekt ist Open Source und die Erweiterung wird als kostenlos beschrieben. Modellkosten entstehen trotzdem, wenn du Cloud-LLMs über eigene API-Schlüssel nutzt.

Läuft Nanobrowser lokal?

Die Extension läuft im lokalen Browser. Je nach Modellanbieter können Prompts und Seitenkontext aber an externe LLM-Dienste gesendet werden.

Für welche Browser ist es gedacht?

Die Dokumentation nennt Chrome und Edge als offiziell unterstützte Browser. Firefox und Safari werden nicht empfohlen.

Was sollte man zuerst testen?

Starte mit einer lesenden Aufgabe auf bekannten Seiten, etwa drei Felder aus 20 Seiten extrahieren und Fehler sichtbar protokollieren.

Nanobrowser: offener Browser-Agent für lokale Web-Automation

Worum es geht

Nanobrowser ist ein Open-Source-Tool für Browser-Automation, das als Chrome- beziehungsweise Edge-Erweiterung läuft. Statt einen entfernten Operator-Dienst zu nutzen, installiert man eine Extension, hinterlegt eigene Modellzugänge und lässt spezialisierte Agenten im eigenen Browser arbeiten. Das Projekt beschreibt sich als freie Alternative zu Operator-artigen Web-Agenten und verweist auf Apache-2.0-Lizenz, GitHub-Code und eine Chrome-Web-Store-Version.

Der Grund, warum das Tool 2026 relevant bleibt, ist einfach: Viele Teams wollen Browser-Agenten testen, ohne sofort Logins, Workflows und Kundendaten an eine zentrale Automationsplattform zu geben. Nanobrowser ist kein Ersatz für saubere API-Integrationen. Es ist ein praktischer Testplatz für wiederkehrende Web-Aufgaben, bei denen Menschen heute noch klicken, vergleichen, kopieren und zusammenfassen.

Was Nanobrowser tatsächlich macht

Nanobrowser setzt eine Seitenleiste in den Browser. Nutzer geben eine Aufgabe in natürlicher Sprache ein, etwa die Top-Meldungen einer Website zu extrahieren oder Informationen aus mehreren Produktseiten zu vergleichen. Dahinter arbeiten mehrere Rollen zusammen: Ein planender Agent zerlegt die Aufgabe, ein navigierender Agent bedient die Seite, und das System kann bei Hindernissen den Plan anpassen.

Wichtig ist die Architekturentscheidung: Die Erweiterung läuft im lokalen Browser des Nutzers. Die Modellaufrufe gehen an die LLM-Anbieter, die der Nutzer selbst konfiguriert, zum Beispiel OpenAI, Anthropic, Gemini, Groq, Cerebras, Ollama oder OpenAI-kompatible Endpunkte. Das macht Kosten und Datenschutz nicht automatisch gelöst, aber sichtbarer. Teams können günstige Modelle für Navigation und stärkere Modelle für Planung testen.

Warum das wichtig ist

Browser-Automation ist eine der ersten Stellen, an denen Agenten konkret nützlich werden können: interne Admin-Oberflächen, Lieferantenportale, Recherche-Seiten, Webformulare oder Wettbewerbsbeobachtung. Klassische RPA bricht oft, wenn Layouts geändert werden. LLM-gestützte Browser-Agenten versprechen mehr Flexibilität, brauchen aber klare Grenzen, gute Protokolle und eine realistische Erwartung an Fehler.

Nanobrowser ist hier interessant, weil es Open Source ist, im Browser sichtbar arbeitet und nicht als Black-Box-SaaS beginnen muss. Der GitHub-Stand zeigt eine aktive Community mit über 13.000 Sternen und mehreren hundert Commits. Gleichzeitig nennt die Dokumentation Einschränkungen: offiziell unterstützt werden Chrome und Edge; Firefox und Safari sind nicht Teil des empfohlenen Setups.

Einfach erklärt

Stell dir Nanobrowser wie einen Praktikanten vor, der neben dir am gleichen Browser sitzt. Du sagst: "Vergleiche diese fünf Angebote und schreibe mir die Preise heraus." Er klickt, liest und notiert. Aber du gibst ihm nicht automatisch Firmenvollmacht, Kreditkarte und freien Zugang zu allem.

Genau so sollte man das Tool behandeln: gut für wiederholbare Recherche- und Eingabeaufgaben, gefährlich bei unklaren Befehlen, sensiblen Logins oder irreversiblen Aktionen.

Praktisches Beispiel

Ein kleines Einkaufsteam prüft jede Woche 40 Lieferantenartikel in drei Webportalen. Manuell dauert das rund 3 Stunden: Produkt suchen, Preis kopieren, Lieferstatus notieren, Tabelle aktualisieren. Mit Nanobrowser könnte das Team zunächst einen eng begrenzten Test bauen: zehn Artikel, nur Leserechte, keine Bestellungen, keine gespeicherten Zahlungsdaten.

Wenn der Agent aus zehn Artikeln acht korrekt verarbeitet und zwei zur manuellen Prüfung markiert, spart das nicht sofort den ganzen Prozess. Aber es zeigt, ob der Workflow stabil genug ist, um daraus später eine API-Integration, ein internes Tool oder eine kontrollierte Browser-Automation zu bauen. Der sinnvolle nächste Test ist daher nicht "Automatisiere unser Portal", sondern "Extrahiere aus 20 bekannten Seiten drei Felder und schreibe Fehler sichtbar in ein Log".

Einordnung und Grenzen

Nanobrowser ist kein Garant für korrekte Ergebnisse. Webseiten ändern sich, Pop-ups stören, Captchas blockieren und Modellantworten können falsche Schlüsse ziehen.
Datenschutz hängt vom gewählten Modellanbieter ab. Wer Cloud-LLMs nutzt, sendet Aufgaben- und Seitenkontext an diesen Anbieter; lokale Modelle senken das Risiko, sind aber oft schwächer.
Für kritische Aktionen wie Käufe, Kündigungen, Vertragsänderungen oder Massen-E-Mails braucht es menschliche Freigabe und technische Sperren.

Für Entwickler und Operations-Teams ist Nanobrowser am stärksten als Lern- und Prototyping-Werkzeug. Wer damit echte Produktionsprozesse baut, sollte Audit-Logs, Berechtigungen, Testdaten und Abbruchregeln von Beginn an mitplanen.

SEO- und GEO-Schlüsselbegriffe

Nanobrowser, AI browser agent, browser automation, Chrome extension, Edge extension, Open Source AI, web automation, local AI agents, BYOK, Ollama, Browser Use, LangChain

Nanobrowser macht Browser-Agenten lokal kontrollierbar