Texte aus geschützten PDF-Dateien erkennen und kopieren mit Google Drive OCR

Viele PDF-Dateien sind geschützt. Das bedeutet: man kann sich den Inhalt nur am Rechner anschauen oder ausdrucken. Mehr nicht. Kopieren oder exportieren lassen sich die Inhalte nicht. Mit einem Trick klappt’s trotzdem. Wer an die Texte einer geschützten PDF kommen möchte, nutzt einfach die Texterkennung von Google Drive. Damit lassen sich Texte beliebiger PDFs oder von eingescannten Bildern erkennen. Sehr zuverlässig sogar.

PDF-Texte per Google-Drive kopieren

Wenn Sie eine geschützte PDF-Datei im Adobe Reader oder einem anderen PDF-Betrachter ansehen, lassen sich die darin enthaltenen Texte zwar markieren, nicht aber exportieren oder in die Zwischenablage kopieren. Der Kopieren-Befehl im Bearbeiten-Menü ist dann ausgegraut und nicht verfügbar.

pdf-texte-extrahieren-exportieren-kopieren-erkennen-texterkennung-google-drive

Mit einem Trick kommt man trotzdem an die Texte ran und kann sie beliebig weiterverwenden. Dazu verwenden Sie einfach die Texterkennung von Google Drive. Mit der OCR-Funktion (Optical Character Recognition) von Google lassen sich Texte nicht nur aus PDF-Dateien, sondern aus eingescannte Dokumente erkennen und extrahieren.

So geht’s:

1. Rufen Sie Ihre Google-Drive-Seite auf, klicken Sie oben rechts aufs Zahnrad, und aktivieren Sie im Untermenü Upload-Einstellungen die Option Text aus hochgeladener PDF- oder Bilddateien konvertieren. Vor dem Befehl muss also ein kleines Häkchen erscheinen; nur dann ist die Texterkennungsfunktion aktiv.

 

2. Anschließend klicken Sie in der linken Spalte auf den roten Upload-Button mit dem Pfeil nach oben, wählen den Befehl Dateien.

3. Wählen Sie die gewünschte PDF- oder Bilddatei aus, und klicken Sie auf Öffnen. Die Datei wird daraufhin nicht nur vom Rechner in die Google-Cloud kopiert, sondern direkt per Texterkennung analysiert.

Das Ergebnis: Im Google-Drive-Bereich finden Sie die hochgeladene PDF-Datei, die nicht nur die einzelnen PDF-Seiten, sondern auch den erkannten Text enthält. Im Drive-Dokument müssen Sie jetzt nur noch die Bilder löschen, und übrig bleibt der erkannte Text. Die Texterkennung liefert nicht immer eine hunderprozentig richtiges Ergebnis; insgesamt kann sich die Erkennungsrate aber sehen lassen.

Die mobile Version verlassen