MolmoAct2 bringt offene KI-Modelle näher an echte Roboter
6. Mai 2026

Ai2 veröffentlicht MolmoAct2 mit offenen Gewichten, Robotik-Daten und Checkpoints. Der reale Nutzen hängt aber stark von Hardware und Sicherheitsgrenzen ab.
Worum es geht
Ai2, das Allen Institute for AI, hat am 5./6. Mai 2026 MolmoAct2 veröffentlicht: eine offene Familie von Action-Reasoning-Modellen für Roboter. Dazu gehören Modellgewichte, Datasets und Checkpoints für unterschiedliche Roboterplattformen.
Die Nachricht ist mehr als ein Modell-Release. Während viele fortgeschrittene Robotiksysteme geschlossen bleiben, legt Ai2 nach eigenen Angaben Gewichte, Trainingsdaten und Teile der Werkzeugkette offen. Für Forschungslabore, Maker und Industrie-Teams kann das den Abstand zwischen Paper und realem Roboter verkürzen.
Was MolmoAct2 tatsächlich macht
MolmoAct2 verbindet Bildverstehen, räumliches Schlussfolgern und kontinuierliche Roboteraktionen. Grundlage ist Molmo2-ER, ein Vision-Language-Modell für embodied reasoning. Darauf sitzt ein Action-Experte, der aus Kamerabildern, Roboterzustand und Sprachinstruktion Bewegungen erzeugt.
Der arXiv-Preprint nennt mehrere Bausteine: ein 3,3-Millionen-Beispiele-Korpus für räumliches und verkörpertes Reasoning, 720 Stunden bimanuale YAM-Trajektorien, gefilterte DROID- und SO-100/101-Daten sowie einen offenen Action-Tokenizer. Die Think-Variante soll zusätzliche Tiefeninformationen nur dort neu berechnen, wo sich die Szene verändert.
Warum das wichtig ist
Robotik leidet unter einem alten Flaschenhals: Gute Modelle brauchen teure Hardware, viel Demonstrationsdaten und meist proprietäre Trainingsrezepte. MolmoAct2 versucht, diesen Flaschenhals zu öffnen. Das GitHub-Repository verweist auf Apache-2.0-Lizenzierung, Hugging-Face-Checkpoints und Datensammlungen für Fine-Tuning und Evaluation.
SiliconANGLE berichtet zudem, dass Ai2 reale Tests in Laborumgebungen und bimanualen Aufgaben beschreibt. Die konkrete Aussage, dass MolmoAct2 bis zu 37-mal schneller als der Vorgänger arbeiten kann, stammt aus der Berichterstattung über Ai2s Angaben und sollte als Herstellerangabe gelesen werden.
Einfach erklärt
Stell dir vor, du bringst jemandem bei, eine Küche aufzuräumen. Ein normaler Roboter merkt sich vielleicht nur: „Greife Tasse, stelle Tasse hin.“ MolmoAct2 soll eher wie ein vorsichtiger Helfer schauen: Wo ist die Tasse, wo ist Platz, was hat sich bewegt, welche Hand ist frei und welche Bewegung ist sicher genug?
Praktisches Beispiel
Ein Uni-Labor möchte Probenplatten zwischen zwei Stationen bewegen. Pro Tag fallen 300 einfache Handgriffe an: Deckel öffnen, Platte aufnehmen, auf ein Gerät legen, wieder abstellen. Mit einem offenen Modell kann das Team zunächst in Simulation und mit 20 eigenen Demonstrationen prüfen, ob ein YAM- oder SO-101-Setup ähnliche Abläufe lernt. Wenn Kamera, Greifer oder Arbeitsfläche abweichen, braucht es Fine-Tuning und Sicherheitsgrenzen statt blindem Deployment.
Einordnung und Grenzen
- MolmoAct2 ist kein fertiger Haushaltsroboter. Checkpoints müssen zur Hardware, Kamera, Kalibrierung und Aufgabe passen.
- Physische Roboter brauchen Not-Aus, Geschwindigkeitsgrenzen, Kraftlimits und menschliche Aufsicht, besonders in Laboren oder Werkstätten.
- Ein offenes Modell löst nicht automatisch Datenqualität, Haftung oder Sicherheitszertifizierung. Es macht diese Fragen nur besser prüfbar.
SEO- und GEO-Schlüsselbegriffe
MolmoAct2, Ai2, Allen Institute for AI, open robotics model, VLA model, robot foundation model, embodied reasoning, bimanual robot dataset, LeRobot, DROID, SO-101, robot safety
💡 Im Klartext
MolmoAct2 ist ein offener Baukasten für Roboter, die sehen, räumlich nachdenken und dann handeln sollen. Es ist Forschung zum Anfassen, aber kein sofort sicherer Alltagsroboter.
Wichtigste Erkenntnisse
- →Ai2 veröffentlicht MolmoAct2 als offene Action-Reasoning-Modellfamilie für Robotik.
- →Der Preprint nennt 720 Stunden bimanuale YAM-Daten und weitere gefilterte Robotik-Datasets.
- →Die Veröffentlichung umfasst Checkpoints und Daten für Fine-Tuning und Evaluation.
- →Reale Einsätze brauchen Hardware-Anpassung, Sicherheitsgrenzen und Aufsicht.
Häufige Fragen
Kann ich MolmoAct2 sofort auf jedem Roboter nutzen?
Nein. Die Checkpoints müssen zur Plattform, Kamera, Steuerung und Aufgabe passen.
Was ist der wichtigste offene Teil?
Gewichte, Datasets und Checkpoints machen die Forschung besser nachvollziehbar und anpassbar.
Warum ist bimanuale Robotik spannend?
Viele reale Aufgaben brauchen zwei Hände oder koordinierte Bewegungen, etwa Aufräumen, Laborarbeit oder Montage.