Text aus einem PDF extrahieren

Laden Sie ein PDF hoch und laden Sie seinen Text als einfache .txt-Datei herunter — alle Seiten oder nur die von Ihnen gewählten. Das Layout wird durch Abstände angenähert.

Warum ist der Text meines gescannten PDFs leer?

Gescannte PDFs enthalten Bilder von Text, keinen echten Text — ohne OCR (das dieses Werkzeug nicht bietet) gibt es nichts zu extrahieren. Es funktioniert bei PDFs mit echtem, markierbarem Text.

Bleibt das Layout erhalten?

Zeilenumbrüche und Spaltenabstände werden angenähert, damit Tabellen und Listen lesbar bleiben. Seiten werden durch ein Seitenvorschub-Zeichen getrennt.