Schlagwort: texterkennung

  • „ReCaptcha“ hat als Bestätigungsfunktion ausgedient. Google stellt die neue „No Captcha reCaptcha“-Methode vor.

    Jeder hat bestimmt schon einmal eine Online-Aktion mit einem reCAPTCHA bestätigen müssen. Diese bestehen meist aus zwei Wörtern, von denen eins gut, das andere nicht gut lesbar ist. Sie sollen sicherstellen, dass der Nutzer menschlich ist und das kein Roboterscript auf diese Webseite zugreift. Kürzlich hat das zum Google-Konzern gehörende Unternehmen ReCAPTCHA eine neue Methode namens No Captcha reCaptcha vorgestellt.

    google-captcha-bestaetigung-bot-script-texterkennung-crowdfunding-nocaptcha

    Die alte Methode basiert auf der Digitalisierung von Texten. Die Texte, die die Texterkennungssoftware nicht auslesen konnte, wurden Teil der reCapture-Bestätigungsmethode. So trugen die User dazu bei, die nicht lesbaren Textpassagen zu entschlüsseln. Vor einiger Zeit wurden sogar noch Hausnummern aus Street-View den Captures hinzugefügt, um Google Maps zu optimieren.

    Da die Entwicklung ja nicht stehenbleibt, hat Google nun eine neue Methode entwickelt, die anhand der Mausbewegung erkennt, ob sich ein Mensch oder ein Roboter-Skript auf der betreffenden Webseite befindet. Es muss lediglich die Checkbox I´m not a robot angeklickt werden. Aus der Mausbewegung heraus erkennt das Script nun Mensch oder Maschine.

    i´m-not-a-robot-google-capture-no-recapture-geknackt-99-prozent-trefferquote

    Diese neue Methode ist nicht auch zuletzt den Gerüchten geschuldet, die behaupten, dass reCaptcha mit einer 99 prozentigen Trefferquote geknackt wurde.

  • OCR-Texterkennung mit Google Notizen auf dem Android

    Mit Apps wie Evernote oder Google Notizen kann man sich schnell Notizen von Dingen machen, die man unterwegs gesehen hat. Dazu muss man noch nicht mal die Notiz eintippen; ein Foto von einem Schild, einer Seite aus einer Zeitschrift oder einer Anleitung genügt. Was kaum bekannt ist: Google Notizen kann das Fotografierte sogar in Text umwandeln. Wir zeigen, wie die versteckte OCR-Texterkennung funktioniert.

    OCR-Texterkennung mit der Notizen-App von Google

    Ein Beispiel: Wenn du unterwegs in einer Zeitschrift ein witziges Zitat siehst und es gerne in Textform weiterverwenden möchtest, kannst du es folgendermaßen in Text umwandeln:

    1. Starte Google Notizen (ehemals Google Keep) und tippe oben rechts auf das Kamerasymbol und dann auf Foto aufnehmen. Mit Bild auswählen kannst du auch ein bestehendes Foto verwenden und es in Text umwandeln lassen.

    google-notizen-keep-ocr-texterkennung-text-erkennen

    2. Fotografiere des gewünschten Text und achte darauf, dass die Buchstaben klar und scharf abgelichtet werden. Je schärfer das Foto, um so besser funktioniert die Texterkennung.

    google-notizen-keep-ocr-texterkennung-text-erkennen-2

    3. Das Foto erscheint nun zunächst als Foto-Notiz im Google-Notizbuch. Um den fotografierten Text erkennen zu lassen, tippst du oben rechts auf das Menü-Icon (mit den drei Punkten) und dann auf Bildtext erfassen.

    google-notizen-keep-ocr-texterkennung-text-erkennen-3

    4. Google versucht anschließend, den fotografierten Text per OCR-Technik zu erfassen. Das klappt bei den meisten gedruckten Texten sehr gut; nur bei handschriftlichen Notizen hapert es noch ein wenig.

    5. Sobald die Texterkennung abgeschlossen ist, kannst du das Originalfoto löschen, indem du auf das kleine X tippst und den Löschvorgang mit Löschen bestätigst. Übrig bleibt der Text in Reinform, der sich von hier aus zum Beispiel bequem per E-Mail, Whatsapp oder SMS verschicken lässt.

    google-notizen-keep-ocr-texterkennung-text-erkennen-4

  • Texte aus geschützten PDF-Dateien erkennen und kopieren mit Google Drive OCR

    Viele PDF-Dateien sind geschützt. Das bedeutet: man kann sich den Inhalt nur am Rechner anschauen oder ausdrucken. Mehr nicht. Kopieren oder exportieren lassen sich die Inhalte nicht. Mit einem Trick klappt’s trotzdem. Wer an die Texte einer geschützten PDF kommen möchte, nutzt einfach die Texterkennung von Google Drive. Damit lassen sich Texte beliebiger PDFs oder von eingescannten Bildern erkennen. Sehr zuverlässig sogar.

    PDF-Texte per Google-Drive kopieren

    Wenn Sie eine geschützte PDF-Datei im Adobe Reader oder einem anderen PDF-Betrachter ansehen, lassen sich die darin enthaltenen Texte zwar markieren, nicht aber exportieren oder in die Zwischenablage kopieren. Der Kopieren-Befehl im Bearbeiten-Menü ist dann ausgegraut und nicht verfügbar.

    pdf-texte-extrahieren-exportieren-kopieren-erkennen-texterkennung-google-drive

    Mit einem Trick kommt man trotzdem an die Texte ran und kann sie beliebig weiterverwenden. Dazu verwenden Sie einfach die Texterkennung von Google Drive. Mit der OCR-Funktion (Optical Character Recognition) von Google lassen sich Texte nicht nur aus PDF-Dateien, sondern aus eingescannte Dokumente erkennen und extrahieren.

    So geht’s:

    1. Rufen Sie Ihre Google-Drive-Seite auf, klicken Sie oben rechts aufs Zahnrad, und aktivieren Sie im Untermenü Upload-Einstellungen die Option Text aus hochgeladener PDF- oder Bilddateien konvertieren. Vor dem Befehl muss also ein kleines Häkchen erscheinen; nur dann ist die Texterkennungsfunktion aktiv.

     

    pdf-texte-extrahieren-exportieren-kopieren-erkennen-texterkennung-google-drive-2

    2. Anschließend klicken Sie in der linken Spalte auf den roten Upload-Button mit dem Pfeil nach oben, wählen den Befehl Dateien.

    pdf-texte-extrahieren-exportieren-kopieren-erkennen-texterkennung-google-drive-3

    3. Wählen Sie die gewünschte PDF- oder Bilddatei aus, und klicken Sie auf Öffnen. Die Datei wird daraufhin nicht nur vom Rechner in die Google-Cloud kopiert, sondern direkt per Texterkennung analysiert.

    pdf-texte-extrahieren-exportieren-kopieren-erkennen-texterkennung-google-drive-4

    Das Ergebnis: Im Google-Drive-Bereich finden Sie die hochgeladene PDF-Datei, die nicht nur die einzelnen PDF-Seiten, sondern auch den erkannten Text enthält. Im Drive-Dokument müssen Sie jetzt nur noch die Bilder löschen, und übrig bleibt der erkannte Text. Die Texterkennung liefert nicht immer eine hunderprozentig richtiges Ergebnis; insgesamt kann sich die Erkennungsrate aber sehen lassen.

    pdf-texte-extrahieren-exportieren-kopieren-erkennen-texterkennung-google-drive-5

  • Mit wenig Aufwand Texte aus Fotos exportieren

    Manchmal liest man in einer Zeitung einen interessanten Artikel , den man später noch mal benötigt. Zum Beispiel im Wartezimmer beim Arzt finden Sie ein tolles Rezept in der Zeitschrift, haben aber nichts um es niederzuschreiben. Mit Sicherheit haben Sie aber Ihr Smartphone in der Tasche. Dann fotografieren Sie den Text einfach um ihn später daraus zu extrahieren. Damit der Text nicht mühsam abgeschrieben werden muss, kann man für diesen Zweck das FreeOCR  Texterkennungsprogramm benutzen.

    Für alle User die kein Microsoft One Note besitzen, oder sich damit nicht befassen möchten, können FreeOCR kostenlos auf der Webseite www.papertile.net herunterladen.

    Rufen Sie die Webseite auf und klicken Sie auf den Button Download Here.

    software-download-installieren-zusaetzlich-achtung-paperfile-bild-tiff-jpg-png-format

    Folgen Sie danach den Download- und Installationsanweisungen. Nachdem der Installations-Assistent gestartet ist, wird versucht drei zusätzliche Programme (Toolbars) zu installieren. Die dazugehörigen Info-Fenster sehen aus wie Bestätigungsfenster von allgemeinen Geschäftsbedingungen. Mit der Schaltfläche Decline (Ablehnen) verweigern Sie deren Installation.

    free-ocr-toolbar-abwaehlen-decline-eula-zusaetzlich-unnoetig

    Nach erfolgreicher Installation starten Sie das Tool FreeOCR für den ersten Einsatz. Oben rechts über OCR-Language stellen Sie die Sprache über das Aufklapp-Menü auf deutsch (deu) ein, damit der Text später korrekt erkannt wird. Dann löschen Sie mit dem roten X-Symbol den vorhandenen Text auf der rechten Bildschirmseite und laden über den Button Open das betreffende Foto hoch.

    free-ocr-software-google-tesseract-project-foto-text

    Mit gedrückter Maustaste ziehen Sie einen Rahmen um den zu extrahierenden Text. Klicken Sie dann in der Symbolleiste auf OCR | OCR Current Page um die Texterkennung zu starten.

    rahmen-tesseract-software-ocr-kostenlos-current-page-text-extrahieren

    Nach ein paar Sekunden wird der erkannte Text auf der rechten Bildschirmseite angezeigt und kann gegebenenfalls noch bearbeitet werden. Die Qualität der Texterkennung ist natürlich auch von der Qualität des Fotos abhängig. Unscharfe Bilder führen zu fehlerhafter Textdarstellung.

    word-einfuegen-text-aus-bild-foto-scanner-pdf-gif-tool-bildformat-ausschnitt

    Mit dem Word-Symbol öffnen Sie ein neues Word-Dokument, in das der Text direkt eingefügt wird. Soll der Text in ein anderes Dokument, zum Beispiel in eine E-Mail eingefügt werden, dann kopieren Sie ihn über die Menüleiste Text | Copy Text to Clipboard in den Zwischenspeicher.

    text-kopieren-zwischenspeicher-sprache-word-clipboard

    Dann nur noch einfügen, fertig!

    FreeOCR ist im Gegensatz zu OCR-Onlinediensten die bessere Wahl. Die Texterkennung von Online-Diensten ist oftmals fehlerhaft, da sie meist für englische Texte optimiert sind. Außerdem werden nicht bei jedem Programm alle Bildformate unterstützt.

    FreeOCR unterstützt neben den populärsten Bildformaten wie JPG, TIFF, GIF auch das  PDF-Format.

  • Das Smartphone zum Speichern von Papierdokumenten und als Kopierer einsetzen

    Wir leben zwar in einer elektronischen Welt, doch noch spielen Papierdokumente in vielen Bereichen des täglichen Lebens eine große Rolle. Sei es die Kommunikation mit Ämtern oder Papierrechnungen, jeden Monat flattern zahlreiche Papiere ins Haus. Möchten Sie die Dokumente auch elektronisch speichern oder auch einfach nur eine Kopie erstellen, können Sie das sehr einfach mit nur wenigen Handgriffen und den richtigen Apps mit dem Smartphone tun. Hier eine kurze Anleitung, wie Sie das Smartphone als elektronischen Dokumentenspeicher oder Kopierer einsetzen.

    Bei vielen Smartphone benötigen Sie keine zusätzlichen Apps sondern die Bordmittel reichen zur Dokumentenerfassung und zum Druck bereits aus. Die integrierten Digitalkameras sind mittlerweile so gut und hochauflösend, dass Sie das betreffende Dokument einfach auf eine gut beleuchtete Unterlage legen und mit dem Smartphone fotografieren können. Sind auf dem erstellten Bild alle gewünschten Details erkennbar, speichern Sie das Dokument einfach und schon haben Sie eine digitale Kopie.

    Haben Sie auch eine Cloudanbindung werden die Dokumente sogar automatisch auf Servern im Netz gespeichert und sind so gegen Verlust gesichert. Möchten Sie eine Kopie auf Papier erstellen, drucken Sie das Dokument einfach aus. Bei vielen Smartphone- und Druckermodellen geht dies sogar direkt vom Smartphone aus.

    Etwas mehr Komfort bieten so genannte Scan Apps, die massenweise in den verschiedenen Appstores verfügbar sind, oft sogar gratis, für Apple zum Beispiel

    oder für Android-Smartphones

    Diese Programme unterstützen Sie beim Fotografieren, wandeln das Dokument anschließend in das gewünschte Format um, können bei Bedarf eine Texterkennung durchführen und speichern die Dateien lokal und optional automatisch in der Cloud. Da die erstellten Dokumente dann zum Beispiel im PDF Format vorliegen, sparen Sie im Vergleich zu den Bilddateien erheblichen Speicherplatz und können so hunderte von Dokumente auf Ihrem Smartphone ablegen. Die Texterkennung ist sehr nützlich, wenn Sie die Texte der gescannten Dokumente anschließend weiterverwenden oder ändern möchten. Auch das Drucken von Dokumenten mit verschiedenen Optionen wird von diesen Apps meist unterstützt.

  • Mit „Scan2PDF“ Dokumente scannen und direkt im PDF-Format speichern

    Nein, „Scan2PDF“ ist nicht noch ein kostenloses Tool zum Umwandeln von Dokumenten in PDF-Dateien. Es ist viel mehr. Es ermöglicht, jeden Scanner – egal ob Flachbett- oder Einzugscanner – als Dokumentenscanner zu nutzen. Gerade bei den Billig-Scannern hapert es oftmals an der mitgelieferten Software.“Scan2PDF“ ist mit allen TWAIN-Scannern kompatibel und enthält auch noch zusätzliche Bearbeitungsfunktionen wie zum Beispiel den E-Mail-Versand per Outlook.

    Nach dem Download und der Installation erkennt das Programm beim Start automatisch alle am Computer angeschlossenen Scanner. Es sind keine zusätzlichen Geräteeinstellungen vorzunehmen. Das Programm ist direkt einsatzbereit. Doch alles der Reihe nach.

    Zuerst rufen Sie in Ihrem Browser die Webseite www.horland.de/scan2pdf-download.html auf, klicken auf den Downloadlink und folgen anschließend den Installationsanweisungen.

    Danach starten Sie das Programm mit einem Doppelklick auf das Desktop-Icon oder über das Startmenü.

    Für einen Scanvorgang benötigen Sie im wesentlichen nur drei Einstellungen, die im linken Bereich des Bearbeitungsfensters vornehmen.

    1. Scanner auswählen
    2. Farbauswahl treffen
    3. Auflösung (DPI) festlegen
    4. Auf „Scannen“ klicken

    Abhängig von der Auflösung dauert es nur ein paar Augenblicke, bis die Vorlage gescannt wurde und auf dem Bildschirm angezeigt wird.

    Mit der Schaltfläche „Bearbeiten“ gelangen Sie zu den Werkzeugen „Marker“ (zum einfärben von Textpassagen), „Drehen“ und „Bearbeiten“ mit den Unterfunktionen „Beschneiden“, „Kurven Werkzeug“ und „Kontrast.

    In der Rubrik „PDF“ kann auch der Header nachträglich noch individuell geändert werden. Alle Funktionen sind im linken Bereich des Programmfensters übersichtlich angeordnet. Wer noch weitere Features wie die OCR-Funktion nutzen möchte, muss sich allerdings für 36 Euro eine Lizenz kaufen. Für den Hausgebrauch reicht die kostenlose Version aber allemal.