cyberivy
DatabricksData IntelligenceLakehouseMosaic AIUnity CatalogAgent BricksSAP DatabricksApache SparkLakebase2026

Databricks 2026: Was die 134-Milliarden-Daten-Plattform wirklich kann

18. Mai 2026

Databricks ist mit einer Bewertung von 134 Milliarden US-Dollar und 5,4 Milliarden US-Dollar annualisiertem Umsatz eine der größten unabhängigen Daten- und KI-Plattformen — und steht 2026 mit SAP-Integration, Agent Bricks und Lakebase besonders im Fokus. Dieser Beitrag erklärt die Firma, ihre Services und wo Stärken und Grenzen liegen.

Worum es geht

Databricks gehört zu den auffälligsten Unternehmen im Daten- und KI-Markt — und ist trotzdem in vielen Mittelstandsdiskussionen unterrepräsentiert. Nach der letzten Finanzierungsrunde im Februar 2026 wird die Firma laut CNBC mit 134 Milliarden US-Dollar bewertet, fuhr sieben Milliarden US-Dollar an Eigen- und Fremdkapital ein und meldete einen annualisierten Umsatz von 5,4 Milliarden US-Dollar bei rund 65 Prozent Wachstum gegenüber dem Vorjahr. Der Umsatzanteil aus KI-Produkten lag bei über 1,4 Milliarden US-Dollar. CEO Ali Ghodsi hat ein IPO 2026 nicht ausgeschlossen. Höchste Zeit für eine sachliche Bestandsaufnahme: Was bietet die Firma eigentlich an, wo sind die Stärken und wo lohnt ein zweiter Blick.

Was Databricks tatsächlich anbietet

Das Unternehmen wurde 2013 von sechs UC-Berkeley-Forschenden gegründet: Ion Stoica, Ali Ghodsi, Andy Konwinski, Matei Zaharia, Reynold Xin und Patrick Wendell — also dasselbe Team, das auch Apache Spark als Open-Source-Projekt entwickelt hat. Ali Ghodsi ist heute CEO. Die zentrale Idee, mit der Databricks gestartet ist, heißt Lakehouse: ein Architekturansatz, der die Flexibilität eines Data Lake mit der Struktur und Performance eines Data Warehouse verbindet. Statt zwei getrennte Systeme zu betreiben, gibt es eine Plattform für klassische SQL-Analytik, ETL, Streaming, Machine Learning und KI.

Das heutige Produktdach heißt Databricks Data Intelligence Platform. Die wichtigsten Bausteine, Stand 2026:

  • Delta Lake als offenes Tabellenformat für die Lakehouse-Schicht.
  • Unity Catalog als zentrale Governance — Berechtigungen, Lineage, Tags, Audit, Attribute-Based Access Control. 2026 unter anderem mit Synchronisation von SAP-BDC-Personendatentags.
  • Mosaic AI als KI-Plattform für Modelltraining, Feinabstimmung, Vector Search, Model Serving und Agentenentwicklung. Über Mosaic AI Model Serving sind 2026 auch Claude Opus 4.7 sowie GPT-5.5 und GPT-5.5 Pro als von Databricks gehostete Modelle erreichbar.
  • Agent Bricks (eingeführt 2025, 2026 weiter ausgebaut) baut KI-Agenten auf eigenen Daten und nutzt automatisch generierte synthetische Trainingsdaten und task-spezifische Benchmarks. Frühe Kunden waren laut Databricks AstraZeneca und Hawaiian Electric.
  • Databricks SQL für klassische BI-Workloads.
  • Lakebase, eine in die Plattform integrierte transaktionale Datenbank auf Postgres-Basis. Damit deckt Databricks erstmals nativ auch OLTP ab und verbindet operative mit analytischen Workloads.
  • Databricks Apps zum direkten Deployen eigener Daten- und KI-Anwendungen.
  • Unity AI Gateway zur zentralen Steuerung und Absicherung externer LLMs und MCP-Endpunkte.

Strategisch besonders relevant ist seit 2025 die Partnerschaft mit SAP: SAP Databricks integriert die Plattform nativ in die SAP Business Data Cloud und macht S/4HANA-Stammdaten ohne klassische ETL-Wege für Databricks-Workloads zugänglich. Die allgemeine Verfügbarkeit wurde 2026 angekündigt.

Warum das wichtig ist

Die Datenarchitektur in vielen Unternehmen ist historisch zerklüftet: ein Data Warehouse für Reports, ein Data Lake für Rohdaten, ein paar Notebook-Server für Data Science, zunehmend ein Modell-Serving-Stack für KI. Databricks bündelt diese Schichten — mit zwei realen Effekten: weniger Datentransporte zwischen Systemen und ein einziger Governance-Punkt für Datenschutz und Compliance.

Gartner prognostiziert, dass bis Ende 2026 mehr als 50 Prozent der Unternehmen eine Lakehouse-Architektur als Fundament für Analytik und KI einsetzen — gegenüber unter 15 Prozent im Jahr 2022. Auch wenn man diese Zahl mit der üblichen Skepsis gegenüber Analyst-Forecasts liest, ist die Richtung klar.

Wer im SAP-Ökosystem arbeitet, sollte das neue SAP-Databricks-Bundle ernsthaft prüfen — der Wegfall klassischer ETL-Strecken aus S/4HANA in eine Analyseumgebung ist für viele Konzerne der teuerste Teil eines Datenprojekts. Wer mit KI-Agenten experimentiert und seine eigenen Daten als Vorteil sieht, findet in Agent Bricks und Mosaic AI eine fertige Pipeline. Und wer bisher Snowflake oder BigQuery nutzt, hat mit Databricks einen direkten Konkurrenten, der vergleichbare BI-Workloads inzwischen über Databricks SQL fährt.

Einfach erklärt

Stell dir vor, dein Unternehmen ist eine Großküche. Bisher hattest du drei verschiedene Lagerräume: einen mit unsortierten Lieferungen (Data Lake), einen mit vorgekochten Zutaten (Data Warehouse) und einen Versuchs-Tisch für neue Rezepte (Machine Learning). Das Problem: jeder Koch läuft zwischen den Räumen hin und her, niemand weiß genau, wo welche Zutat liegt, und manche Tomaten landen doppelt im Inventar. Ein Lakehouse ist eine einzige große Küche mit klarer Beschriftung, Inventarliste, Zugriffsrechten und einer KI-Köchin, die auf Wunsch neue Rezepte entwirft. Databricks verkauft genau diese Küche samt Personal.

Praktisches Beispiel

Ein Konzern mit S/4HANA-Backend und 80 Werken weltweit will den Schichtbedarf je Standort vorhersagen. Heute liegen Materialdaten in SAP, Produktionsstückzahlen in einem MES, Wetterprognosen in einer Drittsystem-Tabelle und Verkaufs-Forecasts in Salesforce. Die alte Pipeline: jede Quelle wird einmal nachts in ein BI-DWH gespiegelt, der Data Scientist bekommt am Morgen einen veralteten Stand und baut sein Modell darauf.

Mit Databricks im SAP-BDC-Setup wird der SAP-Datenstand direkt in der Lakehouse-Schicht sichtbar, ohne dass etwas physisch kopiert wird. Salesforce- und MES-Daten landen über native Connectors im selben Unity Catalog. Ein Mosaic-AI-Modell wird auf der Plattform trainiert, eine Vector-Search-Komponente reichert die Vorhersage um historische Begründungstexte aus dem Service-Ticket-Backlog an, ein Agent Brick fasst täglich die Empfehlungen für die Werkleitung in einem Briefing zusammen. Der Punkt ist nicht, dass irgendein Schritt davon technisch unmöglich anders wäre — der Punkt ist, dass alles in einem Tool mit einer Berechtigungslogik und einer Auditspur passiert.

Einordnung und Grenzen

Drei ehrliche Hinweise.

Erstens, Kosten. Databricks ist auf großen Workloads leistungsfähig, aber selten billig. Die Mischung aus Compute-Stunden, DBU-Faktoren je Cluster-Typ, Modell-Serving-Kosten und zusätzlichen Storage-Gebühren bei den Hyperscalern ist anspruchsvoll zu steuern. Wer ohne FinOps-Disziplin startet, bekommt am Monatsende Überraschungen.

Zweitens, Cloud-Bindung. Die Plattform läuft auf AWS, Azure und Google Cloud. Eine echte On-Premises-Variante existiert nicht. In streng regulierten Branchen oder bei Souveränitäts-Auflagen ist das ein Show-Stopper, der vor dem Kauf zu prüfen ist.

Drittens, Vendor-Lock-in über Governance. Unity Catalog, Mosaic AI und Agent Bricks sind eng verzahnt. Die offenen Schichten — Delta Lake, MLflow, Apache Spark — bleiben portierbar. Die Governance- und Agenten-Schicht ist es weniger. Wer langfristig flexibel bleiben will, sollte Abstraktionsschichten einplanen und Datenmodelle so halten, dass ein Wechsel auf eine andere Lakehouse-Engine ohne Datenverlust möglich bleibt.

Trotzdem: Für die meisten datenintensiven Konzerne ist Databricks 2026 keine Frage des „ob", sondern des „wie tief". Wer im SAP-Umfeld oder im KI-Agenten-Bau ernst macht, kommt an einer fairen Evaluierung kaum vorbei.

SEO- und GEO-Schlüsselbegriffe

Databricks, Data Intelligence Platform, Lakehouse, Apache Spark, Unity Catalog, Mosaic AI, Agent Bricks, Lakebase, Databricks SQL, SAP Databricks, SAP Business Data Cloud, Delta Lake, Ali Ghodsi, Databricks IPO 2026, Snowflake Alternative.

💡 Im Klartext

Databricks ist eine Plattform, auf der Unternehmen ihre Daten an einem Ort zusammenführen, auswerten und für KI nutzen können. Statt getrennte Systeme für Berichte, Datenseen und Machine Learning zu betreiben, gibt es eine einzige Umgebung mit zentraler Berechtigungs- und Audit-Logik. 2026 deckt das Angebot zusätzlich auch Transaktionsdatenbanken, KI-Agenten und eine tiefe SAP-Integration ab.

Wichtigste Erkenntnisse

  • Databricks wurde 2013 von den Apache-Spark-Schöpfern um Ali Ghodsi gegründet und betreibt heute die Data Intelligence Platform mit Lakehouse als Kernarchitektur.
  • Im Februar 2026 schloss die Firma eine Finanzierungsrunde mit Bewertung von 134 Milliarden US-Dollar ab, bei 5,4 Milliarden US-Dollar annualisiertem Umsatz und ~65 Prozent Wachstum.
  • Wichtigste Bausteine 2026: Delta Lake, Unity Catalog (Governance/ABAC), Mosaic AI (inkl. Hosting von Claude Opus 4.7 und GPT-5.5), Agent Bricks, Databricks SQL, Lakebase (Postgres-OLTP), Databricks Apps, Unity AI Gateway.
  • SAP Databricks ist seit 2025 nativ in die SAP Business Data Cloud integriert; S/4HANA-Stammdaten sind ohne klassische ETL nutzbar.
  • Stark in Kombination aus Analyse, ML, KI-Agenten und Governance; Grenzen liegen in Kosten, fehlender On-Premises-Option und Lock-in über Governance- und Agenten-Schicht.

Häufige Fragen

Was ist Databricks in einem Satz?

Eine cloudbasierte Plattform für Daten und KI, die auf einer Lakehouse-Architektur Analytik, ETL, Streaming, Machine Learning und KI-Agenten in einer Umgebung mit zentraler Governance bündelt.

Wer steht hinter Databricks?

Sechs UC-Berkeley-Forschende, darunter CEO Ali Ghodsi und Matei Zaharia. Dasselbe Team hat auch Apache Spark als Open-Source-Projekt entwickelt. Gegründet wurde Databricks 2013.

Was unterscheidet Databricks von Snowflake oder BigQuery?

Snowflake und BigQuery sind stärker auf Data Warehousing fokussiert. Databricks deckt zusätzlich Machine Learning, KI-Agenten, Streaming und mit Lakebase auch transaktionale Workloads ab — in einer Plattform mit gemeinsamer Governance.

Für wen lohnt sich Databricks?

Vor allem für datenintensive Unternehmen, SAP-Anwender, Unternehmen mit eigener Data-Science- oder KI-Mannschaft und solche, die KI-Agenten direkt auf ihren operativen Daten bauen wollen. Bei kleinen Datenmengen und engem Budget gibt es schlankere Alternativen.

Quellen & Kontext