cyberivy
arXivAI ResearchGenerative AIResearch IntegrityLLM HallucinationsAcademic PublishingPreprints

arXiv verschärft Regeln gegen ungeprüften KI-Slop in Papers

20. Mai 2026

Abstrakte Cyber-Ivy-Titelgrafik mit dunklem Hintergrund und leuchtenden grünen Akzenten.

arXiv will Forschende für ein Jahr sperren, wenn Einreichungen klare Spuren ungeprüfter LLM-Ausgaben enthalten. Das ist keine Anti-KI-Regel, sondern eine Haftungsregel für wissenschaftliche Sorgfalt.

Worum es geht

FlowingData berichtete am 20. Mai 2026 über eine Klarstellung bei arXiv: Wer wissenschaftliche Arbeiten mit offensichtlichen, ungeprüften LLM-Spuren einreicht, riskiert eine einjährige Sperre. Genannt werden etwa erfundene Referenzen oder Meta-Sätze aus einem Modell wie "hier ist eine Zusammenfassung" oder "füllen Sie echte Zahlen ein".

Wichtig ist die Unterscheidung: arXiv verbietet generative KI nicht pauschal. Die Verantwortung bleibt bei den Autorinnen und Autoren. Wer seinen Namen auf ein Paper setzt, übernimmt Verantwortung für den Inhalt, egal ob Textteile mit Software, Statistiktools oder Sprachmodellen entstanden sind.

Was die Regel tatsächlich macht

Die Klarstellung zielt auf Fälle, in denen eine Einreichung so deutliche Fehler enthält, dass arXiv den gesamten Beitrag nicht mehr als geprüft ansehen kann. Die beschriebene Sanktion ist hart: ein Jahr Sperre von arXiv und danach zunächst nur noch Einreichungen, die vorher bei einer seriösen Peer-Review-Stelle akzeptiert wurden.

Die Beispiele sind nicht subtil. Halluzinierte Literaturangaben, sichtbare Chatbot-Anweisungen oder Platzhalter für reale Messwerte zeigen, dass niemand die Ausgabe ausreichend kontrolliert hat. Das ist für ein Preprint-Archiv besonders heikel, weil viele Paper dort lange vor formaler Begutachtung sichtbar werden.

Warum das wichtig ist

Preprints sind ein Beschleuniger der Forschung. Sie helfen, Ergebnisse früh zu teilen, Fehler schneller zu finden und Diskussionen zu öffnen. Genau deshalb ist Vertrauen wichtig. Wenn Forschende, Journalistinnen, Unternehmen oder politische Stellen Preprints lesen, müssen sie zumindest davon ausgehen können, dass Autorinnen und Autoren den eigenen Text geprüft haben.

Die Regel ist auch ein Signal an Universitäten und Labore. KI kann beim Schreiben, Übersetzen oder Strukturieren helfen. Aber wenn ein Paper erfundene Quellen oder unersetzte Platzhalter enthält, ist das kein Stilproblem. Es ist ein Qualitäts- und Reputationsproblem.

Einfach erklärt

Das ist wie ein Kuchenrezept, in dem noch steht: "Bitte hier die echte Backzeit einfügen". Niemand würde glauben, dass das Rezept fertig getestet wurde. arXiv sagt im Kern: Wenn solche Spuren in einem wissenschaftlichen Text stehen, behandeln wir nicht nur den Satz als Fehler, sondern das ganze Paper als ungeprüft.

Praktisches Beispiel

Eine fiktive Forschungsgruppe lädt ein Paper mit 18 Referenzen hoch. Zwei davon existieren nicht, eine Tabelle enthält den Satz "replace with final experiment values", und im Fazit steht ein Chatbot-Kommentar. Auch wenn 90 Prozent des Papers sauber sein könnten, kann ein Archiv nicht zuverlässig erkennen, welche Teile geprüft wurden. Die neue Linie macht daraus einen klaren Prozess: Sperre, Vertrauensverlust und später strengere Vorprüfung.

Einordnung und Grenzen

  • Die öffentliche Information stammt bisher vor allem aus der berichteten Klarstellung und einem Social-Media-Post; die praktische Durchsetzung sollte an offiziellen arXiv-Seiten weiter beobachtet werden.
  • Automatische Erkennung von KI-Spuren kann Fehler machen. Entscheidend sind deshalb eindeutige Belege wie sichtbare Platzhalter oder halluzinierte Quellen, nicht bloßer Stilverdacht.
  • Die Regel löst nicht das größere Problem schlechter Forschung. Sie adressiert eine engere Frage: offensichtliche, ungeprüfte Modell-Ausgaben in Einreichungen.

SEO- und GEO-Schlüsselbegriffe

arXiv, generative AI, LLM slop, hallucinated references, research integrity, preprints, scientific publishing, AI policy, Thomas Dietterich, peer review, academic misconduct, FlowingData

💡 Im Klartext

arXiv sagt im Kern: KI darf beim Schreiben helfen, aber Autorinnen und Autoren müssen den Text prüfen. Wer offensichtliche Chatbot-Reste, erfundene Quellen oder Platzhalter einreicht, kann für ein Jahr gesperrt werden.

Wichtigste Erkenntnisse

  • arXiv richtet sich gegen ungeprüfte LLM-Ausgaben, nicht gegen jede Nutzung generativer KI.
  • Klare Spuren wie erfundene Quellen oder Chatbot-Meta-Kommentare können eine einjährige Sperre auslösen.
  • Die Verantwortung bleibt bei den Autorinnen und Autoren eines Papers.
  • Für Preprint-Archive ist geprüfter Text zentral, weil Arbeiten oft vor Peer Review sichtbar werden.

Häufige Fragen

Verbietet arXiv generative KI?

Nein. Die berichtete Klarstellung betrifft ungeprüfte oder offensichtlich fehlerhafte KI-Ausgaben in Einreichungen.

Welche Fehler sind gemeint?

Genannt werden halluzinierte Referenzen, sichtbare Chatbot-Kommentare und Platzhalter, die echte Daten ersetzen sollten.

Warum ist die Sanktion so hart?

Weil solche Spuren zeigen, dass nicht nur ein einzelner Satz, sondern die Sorgfalt der gesamten Einreichung fraglich ist.

Quellen & Kontext