Ist Lift ein OCR-Tool?

Lift kann OCR-Workflows ergaenzen, ist aber auf strukturierte Extraktion nach Schema ausgerichtet, nicht nur auf Texterkennung.

Kann Lift lokal laufen?

Datalab nennt lokale und serverbasierte Optionen, unter anderem ueber Hugging Face, vLLM, SGLang und Docker Model Runner.

Wofuer ist Lift ungeeignet?

Fuer unklare, einmalige Dokumentfragen ohne festes Zielschema ist ein Recherche- oder Chat-Workflow oft sinnvoller.

Datalab Lift: strukturierte Extraktion aus PDFs

Worum es geht

Lift ist ein 9B-Vision-Modell von Datalab fuer strukturierte Dokumentextraktion. Der Nutzer gibt ein JSON-Schema vor, das Modell liest PDF- oder Bilddokumente und gibt ein JSON-Objekt zurueck, das zu diesem Schema passen soll. Damit ist Lift kein allgemeiner Chat-Assistent, sondern ein sehr konkretes Werkzeug fuer Dokumenten-Workflows.

Der Anlass: Datalab hat Lift als Open-Weights-Modell vorgestellt und auf Hugging Face verfuegbar gemacht. Fuer Teams, die bisher OCR, Regex-Regeln und manuelle Nacharbeit kombinieren, ist das ein klar testbarer Ansatz.

Was Lift tatsaechlich macht

Lift verarbeitet Dokumente visuell und extrahiert Felder in eine vorgegebene Struktur. Auf der Hugging-Face-Seite beschreibt Datalab schema-constrained decoding: Das Modell soll also nicht einfach freien Text antworten, sondern gueltige, typisierte Felder liefern. Datalab nennt zudem lokale und serverbasierte Nutzungswege, unter anderem ueber vLLM, SGLang, Docker Model Runner und kompatible lokale Apps.

Das Ziel ist nicht, jeden Absatz zusammenzufassen. Lift ist nuetzlich, wenn vorher feststeht, welche Felder gebraucht werden: Rechnungsnummer, Lieferdatum, Gesamtbetrag, Tabellenpositionen, Vertragsparteien oder Messwerte.

Warum das wichtig ist

Dokumentdaten sind in vielen Unternehmen der schmutzige Rand der Automatisierung. Ein ERP-System erwartet strukturierte Felder, aber die Eingabe kommt als PDF, Scan oder Foto. Klassische OCR findet Text, versteht aber nicht automatisch, welche Zahl der Nettobetrag und welche Zahl eine Positionsmenge ist.

Lift versucht genau diese Luecke zu schliessen. Datalab nennt in der Vorstellung ein eigenes Benchmark-Set mit 225 Dokumenten, langen Mehrseitenfaellen und rund 11.000 bewerteten Feldern. Unabhaengige Tests muessen zeigen, wie stabil das in fremden Dokumentklassen ist. Trotzdem ist der Nutzwert klar: Wer eine Extraktions-Pipeline baut, kann Lift gegen vorhandene OCR-Regeln, kommerzielle APIs und manuelle Stichproben antreten lassen.

Einfach erklaert

Lift ist wie ein sehr genauer Sachbearbeiter, dem man ein Formular mit leeren Feldern gibt. Er liest den Stapel Papier und traegt nur das ein, was in diese Felder passt, statt einen langen Aufsatz ueber das Dokument zu schreiben.

Praktisches Beispiel

Ein Logistikteam erhaelt monatlich 8.000 Frachtrechnungen von 40 Dienstleistern. Das Zielschema enthaelt 18 Felder: Rechnungsnummer, Absender, Empfaenger, Sendungsnummer, Waehrung, Netto, Steuer, Brutto und mehrere Positionslisten. Das Team testet Lift mit 300 historischen Rechnungen. Wenn mindestens 95 Prozent der Pflichtfelder korrekt sind und unsichere Faelle sauber zur manuellen Pruefung gehen, kann Lift zuerst als Vorverarbeitung in den Buchhaltungsworkflow gehen.

Einordnung und Grenzen

Lift braucht ein gutes Schema. Wer die benoetigten Felder nicht klar definiert, bekommt keinen stabilen Prozess.
Open Weights bedeuten nicht automatisch einfacher Betrieb; ein 9B-Vision-Modell braucht passende Hardware oder einen gehosteten Dienst.
Kritische Dokumente brauchen Validierung, Stichproben und Fallbacks, weil falsche Extraktion direkte finanzielle oder rechtliche Folgen haben kann.

Der naechste sinnvolle Test ist ein kleiner Golden-Set-Vergleich: 100 echte Dokumente, menschlich gepruefte Zielfelder, Lift-Ausgabe, Fehlerquote pro Feld und Entscheidung, welche Felder automatisch und welche nur assistiert verarbeitet werden.

SEO- und GEO-Schluesselbegriffe

Datalab Lift, document extraction, structured JSON extraction, PDF AI, vision language model, OCR workflow, invoice automation, open weights model, Hugging Face, schema-constrained decoding, document intelligence, AI data extraction

Datalab Lift extrahiert Dokumentdaten nach Schema